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Apresentação da Coleção 


Esta publicação é parte da Coleção de Linguística da Vozes, retomada 
pela editora em 2014, num esforço de dar continuidade à coleção coorde- 
nada, até a década de 1980, pelas professoras Yonne Leite, Miriam Lemle 
e Marta Coelho. Naquele período, a coleção teve um papel importante no 
estabelecimento definitivo da Linguística como área de pesquisa regular no 
Brasil e como disciplina fundamental da formação universitária em áreas 
como as Letras, a Filosofia, a Psicologia e a Antropologia. Para isso, a cole- 
ção não se limitou à publicação de autores fundamentais para o desenvol- 
vimento da Linguística, como Chomsky, Langacker e Halliday, ou de lin- 
guistas brasileiros já então reconhecidos, como Mattoso Câmara; buscou 
também veicular obras de estudiosos brasileiros que então surgiam como 
lideranças intelectuais e que, depois, se tornaram referência para a discipli- 
na no Brasil - como Anthony Naro, Eunice Pontes e Mário Perini. Dessa 
forma, a Coleção de Linguística da Vozes participou ativamente da história 
da Linguística brasileira, tendo ajudado a formar as gerações de linguistas 
que ampliaram a disciplina nos anos de 1980 e 1990 — alguns dos quais 
ainda hoje atuam intensamente na vida acadêmica nacional. 

Com a retomada da Coleção de Linguística pela Vozes, a editora quer 
voltar a participar decisivamente das novas etapas de desenvolvimento da 


disciplina no Brasil. Agora, trata-se de oferecer um veículo de dissemi- 
nação da informação e do debate em um novo ambiente: a Linguística é 
hoje uma disciplina estabelecida nas universidades brasileiras; é também 
um dos setores de pós-graduação que mais crescem no Brasil; finalmente, 
o próprio quadro geral das universidades e da pesquisa brasileira atingiu 
uma dimensão muito superior à que se testemunhava nos anos de 1970 a 
1990. Dentro desse quadro, a Coleção de Linguística da Vozes tem novas 
missões a cumprir: 

- em primeiro lugar, é preciso oferecer aos cursos de graduação em Le- 

tras, Filosofia, Psicologia e áreas afins material renovador, que permita 

aos alunos integrarem-se ao atual patamar de conhecimento da área de 

Linguística; 

- em segundo lugar, é preciso continuar com a tarefa de colocar à dis- 

posição do público de língua portuguesa obras decisivas do desenvolvi- 

mento, passado e recente, da Linguística; 

- finalmente, é preciso oferecer ao setor de pós-graduação em Linguís- 

tica e ao novo e amplo conjunto de pesquisadores que nele atua um 

veículo adequado à disseminação de suas contribuições: um veículo sin- 
tonizado, de um lado, com o que se produz na área de Linguística no 

Brasil; e, de outro, que identifique, nessa produção, aquelas contribui- 

ções cuja relevância exija uma disseminação e atinja um público mais 

amplo, para além da comunidade dos especialistas e dos pesquisadores 
de pós-graduação. 

Em suma, com esta Coleção de Linguística esperamos publicar títu- 
los relevantes, cuja qualidade venha a contribuir de modo decisivo não 
apenas para a formação de novas gerações de linguistas brasileiros, mas 
também para o progresso geral dos estudos das Humanidades neste iní- 
cio de século XXI. 

Gabriel de Ávila Othero 
Sérgio de Moura Menuzzi 
Organizadores 


O Início, o Fim & o Meio 


What seems to me remarkable about the linguistic system 
is that it has amazingly elegant properties regardless of 
the utterly bizarre uses humans can put this system to. 
Iread Chomsky as taking a stab at this mystery. 


(Juan Uriagereka) 


You are not hardcore unless you live hardcore. 
(Dewey Finn) 


Dedico este trabalho, 

com admiração, gratidão e afeto, 
à professora Miriam LeMLE, 
chomskyana at the core. 


I GET HIGH WITH A LITTLE HELP FROM MY FRIENDS 


Embora eu seja o único responsável pelos excessos e pelas lacunas deste 
livro, sou obrigado a dividir os méritos com muitíssimas pessoas a quem 
devo agradecer agora. 

No princípio, Ilza Ribeiro me apresentou o mundo da linguística 
chomskyana e me deu régua e compasso para eu traçar meu caminho por 
ele. Já nas minhas primeiras erranças, em meio aos muitos obstáculos que 
eu não sabia se eram gigantes ou moinhos, foi Charlotte Galves quem me 
mostrou que tudo o que Chomsky escreve é de uma clareza ímpar, o que 
só se percebe se lermos cada texto no contexto da obra como um todo e 
ligarmos os pontos, após percorrermos o caminho inteiro, pois Chomsky 
sempre pressupõe que seu leitor não é medíocre nem preguiçoso, nem ig- 
norante quanto a todo o conhecimento de fundo subjacente a seus textos. 
Aprendi com Mary Kato que as análises se vão e as generalizações empíri- 
cas ficam, e que isso é legado do próprio Chomsky. Jairo Nunes me ensinou 
a fazer as contas. 

Entre tantos mestres e mentores brilhantes que tive, Norbert Horns- 
tein, Paul Pietroski, Howard Lasnik, David Lightfoot, Stephen Crain, Amy 
Weinberg, Colin Phillips (e Robert Frank, por adjunção) me ensinaram a 
ajustar o foco dos meus olhos (vestidos de lunetas) para ler com nitidez 
tanto os detalhes finos do formalismo como o panorama filosófico geral da 
obra chomskyana. Ao longo dessa trajetória ninguém sequer passou per- 
to de me ensinar a compreender Chomsky tanto quanto Juan Uriagereka, 
que, para além das tecnicalidades essenciais e contingenciais de Chomsky, 
também me revelou a natureza e o propósito do modus operandi de Noam 
na academia e, sobretudo, o espírito estético de seu paradigma científico, 
no qual criatividade e ousadia é tudo! Para além do muito que aprendi com 
ele e que constitui meu background geral sobre a linguística chomskyana, 
confesso na largada que há neste livro uma meia dúzia de elementos que, de 


modo direto ou indireto, têm origem em interações que tive com ele, mas 
para os quais não há meios formais de lhe dar crédito. 

Na última década, tenho tido a felicidade de ter Miriam Lemle como 
interlocutora próxima, compartilhando sentimentos de serenidade, indig- 
nação, convicções e incertezas em relação à vida intelectual como um todo, 
e em particular em relação à forma e ao conteúdo dos debates em torno 
de Teoria da Gramática. Quem leu seu livro Análise Sintática (teoria geral 
e descrição do português), de 1984, perceberá de onde me veio a inspiração 
para adotar um tom mais genuinamente chomskyano de redação, em que, 
mesmo numa introdução, o leitor não é tratado como 'café com leite” e não 
lhe é sonegada a complexidade real do tema. 

Aos meus editores Gabriel Othero e Sérgio Menuzzi, agradeço muito 
pela intensa interlocução e pela confiança depositada em mim, dando-me 
oportunidade de concretizar um sonho antigo de apresentar Chomsky 
para o público geral num “papo reto” sem 'ensaboar”. 

Foi crucial para a realização deste projeto estar num ambiente acadêmi- 
co fértil. Devo muito disso às minhas colegas Maria José Foltran, Patrícia 
Rodrigues e Maria Cristina Figueiredo Silva, a quem sou muy grato pela 
interlocução infinita e pela cumplicidade na alegria e na tristeza. À última 
agradeço ainda pela leitura minuciosa do manuscrito e pelo generoso texto 
de apresentação deste volume. Entre os colegas cuja interlocução gira em 
torno de temas pouco ou nada chomskyanos, eu não poderia deixar de 
agradecer a Lígia Negri e Renata Telles, pelo pragmatismo e pela poesia que 
elas trazem para o meu dia a dia. 

Na última década, Andrew Nevins, Ruth Lopes, Cilene Rodrigues e 
Marcelo Ferreira têm sido interlocutores especiais, com quem aprendo 
muito sobre teoria gramatical e experimentação. Entre os demais colegas 
que também me inspiraram e ajudaram durante este projeto, destaco An- 
drea Knópfle, Marcus Maia, Rerisson Cavalcante, Elaine Grolla, Renato 
Basso, Gesoel Mendes, Marcos Carreira, Maurício Cardozo, lan Roberts 
e Didier Demolin. 


Aos meus alunos que não ficam melindrados com a minha pegada fo- 
doriana e que compartilham comigo o princípio moral da reciprocidade, 
agradeço imensamente por derramarem o leite bom na minha cara e o leite 
mau na cara dos caretas! 4) 

A essa gente careta e covarde que ama odiar a minha individualidade e a 
minha independência das amarras violentas do coletivismo vitimista hipó- 
crita institucionalizado, deixo aqui, com piedade, um agradecimento pelo 
combustível que alimenta diariamente o meu fogo e fortalece as minhas 
convicções éticas e morais. 7))+>"C)k?r, REL vBjoda , 

A quem compartilha comigo os genes, a história, a moral, o propósito — 
Murilão, Dadá, Fredão, Bia, Tuca — ofereço este verso ancestral e atemporal: 
Meu amor, apesar desta distância, não há perdido constância! 

Foxey Lady, você, que me iluminou e me regou da raiz ao fruto dessa 
semeadura, look here, read what I wrote on my shirt: “For long you live and 
high you fly / And smiles yow'll give and tears yowll cry / And all you touch 
and all you see / Is all your life will ever be”. Jamais esquecerei o chá debai- 
xo do guarda-chuva e todo o infinito universo gerado fortemente naquele 
big-bang. 

Melhor Cidade da América do Sul, 
um HOJE feliz de dois mil e dezesseis, 
MAXIMILIANO GUIMARÃES 
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S1. As Raízes, as Bases & 
os Radicais 


851.1.0 ESCOPO, OS OBJETIVOS, A SUBSTÂNCIA E A FORMA 
DESTE LIVRO 


Poucos são indiferentes à vasta obra de Noam Chomsky em linguiís- 
tica. Tamanha é sua influência, que é quase impossível ignorá-lo. Certas 
ou erradas, suas ideias costumam ser originais e ousadas, despertando ar- 
roubos irracionais de amor ou ódio antes mesmo de serem examinadas. 
Infelizmente, muitos de seus followers e haters não compreendem sua obra. 
Tendo lido apenas fragmentos aleatórios ou resenhas de terceiros, perpe- 
tuam inverdades, subestimando, superestimando ou forjando méritos ou 
deméritos. Uns ficam imediatamente fascinados e outros imediatamente 
ofendidos pela perspectiva (herética?) de se investigar a linguagem humana 
com o arcabouço conceitual das ciências naturais, fora da jurisdição epis- 
temológica das humanidades. Uns e outros imediatamente e acriticamente 
acatam ou descartam tal abordagem. Difundem uma 'versão pirata dela, 
sem reproduzir todos os passos lógicos da argumentação nem prover os 
dados empíricos-chave para defender ou criticar apropriadamente o pa- 
radigma chomskyano. Este livro pretende evitar tais incompreensões por 
parte de quem não leu e não gostou, ou gosta sem ter lido. Aos agnósticos 
com pouco contato direto com a obra chomskyana, pretendo guiá-los no 


caminho de leituras futuras, apontando armadilhas, atalhos, precipícios, 
pontes, desertos e campos férteis. 

O público-alvo primeiro deste livro é o estudante universitário de Le- 
tras, Linguística e áreas afins, como Psicologia e Filosofia. Dirijo-me tam- 
bém ao profissional dessas áreas que não trabalha diretamente com teoria 
da gramática, mas cujos interesses a perpassam. Por ser um texto semi-in- 
trodutório, outros leitores podem aproveitá-lo, mas terão de lidar com 
certas lacunas, pois pressuponho familiaridade com fatos e conceitos de 
linguística geral e teoria gramatical tipicamente abordados em disciplinas 
do primeiro ano de graduação em Letras'. Este livro não se pretende um 
manual que habilite o estudante a manipular as ferramentas de análise gra- 
matical do quadro chomskyano para aplicá-las a exemplos concretos do 
português ou outras línguas, pois já existem obras que cumprem tal fim”. 
Meu objetivo é ajudar o leitor a compreender Chomsky num sentido com- 
plementar a saber manipular o aparato técnico-analítico aplicável a dados. 
Há vários modos de se fazer teoria e análise gramatical. Por que alguém 
deveria adotar ou rejeitar o modo chomskyano de fazê-lo? Para tomar par- 
tido, é preciso conhecer minimamente o objeto de estudo, os objetivos, os 
métodos, as premissas, e as bases empíricas e conceituais nas quais o para- 
digma chomskyano se sustenta”. 

O chamado paradigma chomskyano é um empreendimento coletivo, e a 
avaliação de seus méritos e deméritos deve levar em conta a obra de muitos 


1. É desejável que o leitor tenha alguma familiaridade com parte das noções a seguir: fone- 
ma, morfema, sintagma, sentença, enunciado, denotação, referência, categoria, função, regra, 
léxico, fonologia, morfologia, sintaxe, semântica, variação e mudança (cf. Crystal 1985; Fiorin 
2002, 2003; Schwindt 2014). 


2. Obras em português recomendadas: Raposo (1979), Othero (2014) e Mioto (2009) são 
boas introduções; Lemle (1984), Mioto et al. (2013) e principalmente Raposo (1992) apro- 
fundam mais; Kato & Nascimento (2009) priorizam uma descrição do português. Obras 
em inglês recomendadas: Haegeman (1990), Roberts (1997), Carnie (2002, 2010), Cook & 
Newson (2007), Larson (2010), Freidin (1992, 2012) e Adger (2013). 

3. Cf. também Raposo (1978), Uriagereka (1998), Yang (2006), Larson (2010) e Boeckx 
(2010). 


autores dessa corrente, bem como a de oponentes. Em última instância, é 
muito mais relevante discutir o conjunto de obras que constituem tal para- 
digma do que apenas a obra de Chomsky em si mesma. Mas é inegável que 
Chomsky não apenas foi o fundador da Gramática Gerativo-Transforma- 
cional (GGT). Ele também tem sido o seu pesquisador mais influente, cuja 
obra tem mais impacto na linguística em geral. Embora este livro seja, em 
ampla medida, sobre a GGT como um todo, ele cumpre uma tarefa espe- 
cífica que me foi atribuída pelos editores da Coleção de Linguística, a saber: 
descrever e explicar as idiossincrasias desse linguista cuja obra individual 
reconhecidamente teve um impacto extraordinário na linguística geral. Por 
isso, na narrativa que se segue, Chomsky é protagonista e diversos autores 
importantes são coadjuvantes. Uso amplamente e sem pudores o adjetivo 
chomskyano para designar propostas teóricas e analíticas da GGT", Muitos 
autores rejeitam essa retórica justamente para evitar a interpretação equi- 
vocada de que a GGT se resumiria às posições pessoais de Chomsky. Quem 
acompanha a literatura técnica da GGT sabe que não se trata disso”. Come- 
çar a compreender a GGT a partir da obra individual de Chomsky não é a 
única possibilidade, nem necessariamente a melhor, Mas é uma possibili- 
dade legítima, que ora se oferece. 

Infelizmente, o ensino de GGT no Brasil se dá quase como se tudo ti- 
vesse começado em 1981, ignorando-se muito da produção anterior, como 
se os frutos das obras seminais estivessem ou implícitos nos trabalhos pos- 
teriores ou ultrapassados. Tal lacuna na formação de nossos sintaticistas 
é uma das causas de Chomsky ser tão incompreendido. Compreender as 
versões mais recentes da GGT pressupõe uma boa compreensão das versões 


4. Grosso modo, GGT está para chomskyano assim como Teoria da Evolução está para (neo) 
darwinista. 

5.A propósito, Chomsky (1982b) abre seu livro com o seguinte reconhecimento: “Dedica- 
tória: a todos os gerativistas que, não importando o quão longe estejam, o quão isolados, 
o quão minoritários, devotam seus esforços a progredir em nossa busca coletiva por novos 
insights em teoria da gramática”. 


iniciais. Há muita bibliografia sobre o meio da história e pouca sobre o 
início. O destaque que dou à'GGT retrô” visa diminuir esse problema. Não 
há atalhos. Há que se começar do começo. 

Desde já, deixo claro que não adoto aqui uma postura escorregadia de 
forjar uma neutralidade em relação ao paradigma chomskyano que apre- 
sento, Defendo explicitamente que, a despeito de suas muitas falhas e in- 
completudes, ele é, de longe e com uma ampla vantagem sobre os con- 
correntes, a melhor concepção de gramática de que dispomos até hoje. 
Entretanto, francamente, eu não estou aqui, de modo algum, para conven- 
cer você a se tornar “um novo membro do clube”. Meu verdadeiro e único 
objetivo é ajudar você a começar a compreender a obra de Chomsky (e a 
literatura da GGT em geral) pelo que de fato há nela, e não pelas muitas 
versões distorcidas que há por aí, publicadas ou ditas em aulas, palestras 
e bate-papos de cantina. Não serei condescendente aqui com aqueles que 
propagam aos quatro ventos tais distorções. Não posso ignorá-los todos, 
pois, dado o quão difundidas tais distorções são e o quão convincentes elas 
parecem ser a olhos desavisados, a minha tarefa de fazer você compreender 
Chomsky se funde com a de fazer você compreender a incompreensão dos 
que não o compreendem. Se, aqui e ali, parecer que “pego pesado” com al- 
guém, tenha certeza de que (i) é isso mesmo; (ii) faço isso com quem pega 
mais pesado ainda*; e (iii) isso é sinal de respeito com quem tem poder de 
persuasão destacado para ser formador de opinião. 

Muitos julgam Chomsky como um intransigente e autoritário que ja- 
mais “dá o braço a torcer” para reconhecer quando outros têm razão, sendo 
assim um “xerifão, dono da teoria” que “corta as asinhas” de quem ousa “al- 


6. Ver, por exemplo, os pesadíssimos ataques ad nominem de antagonistas ferozes como 
Geoffrey Pullum e Paul Postal (inter alia), quando eles se opõem a Chomsky. Uma pas- 
sagem emblemática na história da GGT que ilustra esse ponto muito bem é a resposta de 
Chomsky (1990) aos ataques truculentos que ele recebera de Pullum (1989). Compare 
os discursos e tire suas próprias conclusões. Mais recentemente, Postal (2004) dedica um 
livro inteiro a difamar a GGT como sendo 'um lixo. Tais ataques foram rebatidos por 
Boeckx (2006b). 


çar voos próprios, decidindo sozinho os rumos da GGT. Ademais, ele tem 
a má fama de ser agressivo com seus opositores nos debates. Permito-me 
dizer o óbvio aqui: o cientista deve buscar a verdade; e não buscar ser o 
mocinho da trama por quem todos torcem. Tão absurdo quanto morrer 
com nossos princípios por pura vaidade é assumir posições conciliatórias/ 
intermediárias por política de boa vizinhança. Os relativistas que não me 
perdoem, mas a realidade é objetiva e cartesiana, e independe do marke- 
ting pessoal de 'bom moço; “ponderado” e “cabeça aberta. Gostem ou não, 
lá se vão seis décadas e meia de GGT, em que se acumularam mais êxitos 
que fracassos no cômputo geral, embora muitos não compreendam isso. 
E basta acompanharmos o passo a passo da literatura da GGT para perce- 
bermos o quanto ideias divergentes às de Chomsky circularam livremen- 
te nos debates internos da GGT e foram independentemente exploradas 
por vários pesquisadores sem nenhuma sabotagem por parte de Chomsky, 
apenas discordância, e em umas tantas vezes tais ideias acabaram sendo 
adotadas por ele. 

O que ora digo só pode ser demonstrado após análise minuciosa da 
obra de Chomsky e de seus antagonistas. Lamentavelmente, abundam 
pseudotratados de historiografia, metateoria e filosofia da linguistica que 
não passam de queixas vazias, discutindo questões supostamente maiores, 
como a história e a estrutura retórica das polêmicas, as vaidades dos egos, 
etc., sem abordar questões supostamente menores (porém as únicas reais, 
relevantes e tangíveis) acerca do quanto as propostas de Chomsky têm 
a cobertura empírica almejada via análises logicamente consistentes (cf. 
Chomsky 1982b: 48). Avaliações constrangedoramente rasas forjam pro- 
fundidade com discursos pomposos de epistemólogo onisciente, sem ofe- 
recer como alternativa uma análise significativa dos dados em pauta, como 
se fosse possível avaliar teorias sem medir o quanto elas dão conta dos fatos. 
Ao esmiuçarem entrelinhas retóricas de Chomsky, seus antagonistas con- 
cluem que ele é o vilão da trama, que sabota a criatividade, a iniciativa e a 
produtividade dos mocinhos (cf. Botha 1989; Borges Neto 2004); que ele se 
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apropria de ideias que antes condenara (cf. Pullum (1996) sobre Chomsky 
(1993a)); que ele reescreve a história “cabotinamente”, apagando feitos de 
gigantes em cujos ombros teria subido, ao afirmar que a GGT foi o início 
da linguística genuinamente científica (cf. Faraco (2000) sobre Chomsky 
(1997a/b))'; e que ele faz uso indevido, aproveitador e inconsistente das 
ideias pré-estruturalistas que cita (cf. Joseph 2010). 

A propósito, conto agora o segredo mais malguardado da Linguística. 
Examinando-se com cuidado o estilo de Chomsky, vê-se facilmente que ele 
trata a todos de igual para igual. Não trata os catedráticos com a mínima 
reverência, nem os novatos como 'café com leite. “Pau que dá em Chico dá 
em Francisco”! Sem o tom dramático de um Jerry Fodor ou um Norbert 
Hornstein (falarei deles adiante), Chomsky encara confrontos com fala se- 
rena, monotônica; corpo estático; vocabulário estritamente técnico, quase 
sem licenças poéticas, slogans de efeito ou sarcasmo (exceto quando discute 
política). O peso de seu discurso reside apenas em seus argumentos”. Mes- 
mo assim ele tem fama de 'rolo compressor. Sempre foi assim. Por quê? 
Não sei. Só sei que foi assim. E sempre será enquanto não compreenderem 
que seu maior defeito é tratar pessoas intelectualmente abaixo dele como 
seus pares; e que sua maior virtude é, acima de tudo, tratar qualquer pessoa 
como um intelectual, partindo da premissa de que a academia não é lu- 
gar para melindrosos, e que o fazer científico envolve duras disputas sobre 
quem está mais próximo da verdade, nas quais qualquer um pode ganhar 
ou perder. Doa em quem doer, Chomsky já ganhou muito mais do que 
perdeu desde 1951. 


7. CE. Boeckx (2015; 150-151) para uma crítica ao diagnóstico de Pullum (1996). 

8. Chomsky (1997a/b) é bem imodesto ao afirmar que a linguística genuína se iniciou com 
a GGT, que descobriu mais fatos do que se descobriu em séculos anteriores. Não importa se 
isso soa “megalômano”, mas se isso é verdade. Foi a partir da GGT que floresceu a linguis- 
tica enquanto ramo das ciências cognitivas (mas note-se que Chomsky (1997c) reconhece 
isso como a segunda revolução cognitiva, tendo a primeira ocorrido no séc. XVII). 

9. Abundam na internet palestras e entrevistas de Chomsky. Sugiro que você as veja e tire 
suas conclusões. 
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Nos capítulos que se seguem trato dos seguintes tópicos: (i) fundamen- 
tos teórico-metodológicos da GGT, a definição de seu objeto de investigação 
e de sua base empírica (cf. $2); (ii) aspectos da formalização matemática do 
núcleo duro da sintaxe (cf. $3); (iii) motivações e consequências da con- 
cepção de sintaxe da GGT para o estudo dos aspectos de som e significado 
das expressões linguísticas (cf. $4); (iv) uma demonstração passo a passo 
da lógica que sustenta a tese do inatismo gramatical, com uma amostra de 
sua sustentação empírica, e uma discussão da tensão entre previsões sobre 
variação e universalidade que se seguem daí (cf. $5); e uma breve conclusão 
apontando para leituras que promovem a expansão da compreensão da 
obra chomskyana para além do que caberia neste livro (cf. $6). 

Na medida do possível, procurei cumprir o desafio de ilustrar os pontos 
teórico-analíticos sob discussão com dados empíricos do português, língua 
na qual a grande maioria dos meus leitores típicos têm intuições de falante 
nativo (de algum dialeto, não necessariamente o(s) mesmo(s) que adoto 
como referência). O caráter desafiador dessa tarefa se deve ao fato de que 
o que está em jogo o tempo todo nessa discussão é a Faculdade da Lingua- 
gem, compartilhada por todos os membros da espécie homo sapiens sapiens, 
manifesta de formas distintas, porém similares em todas as línguas, o que 
torna a comparação constante entre línguas não só desejável como também 
imprescindível (cf. Roberts 1997). Em benefício da fluidez da leitura, optei 
por priorizar os exemplos em português, mas lanço mão de exemplos de 
outras línguas quando eles se revelam absolutamente necessários. 

A propósito, traduzi eu mesmo todos os trechos de obras estrangeiras 
citadas, mesmo se já houvesse tradução em português. Fiz isso visando a 
fluidez de leitura, não misturando estilos de tradução muito díspares e dis- 
tantes no tempo (por exemplo, uma tradução do lusitano Eduardo Rapo- 
so da década de 1970, embora ótima, é inadequada aqui). E como toda 
tradução é uma leitura, assim ofereço ao público um panorama da obra 
chomskyana com mais comensurabilidade entre os trabalhos, lidos em pa- 
ralelo a partir do mesmo olhar. 


51.2. NOAM CHOMSKY: O INTELECTUAL, A OBRA, O PERCURSO 


Avram Noam Chomsky (nascido em 7 de dezembro de 1928 na Filadél- 
fia, EUA), é catedrático emérito do Departamento de Linguística e Filosofia 
do MIT (Massachusetts Institute of Technology), onde leciona desde 1955. 
Ele tem sido um dos intelectuais mais influentes de sua época”, e um dos 
dez autores mais citados de todos os tempos”. Seu trabalho em linguística é 
pioneiro e revolucionário em vários aspectos. Ele também tem sido um dos 
mais atuantes ativistas e analistas políticos contemporâneos, cuja causa/ 
temática principal é sua crítica severa ao forte intervencionismo da política 
externa do governo dos EUA e à manipulação da informação e da opinião 
pública pela grande mídia. Aliás, sua produção sobre política é bem mais 
pervasiva e influente que sua obra em linguística”. 

A formação acadêmica de Chomsky se deu toda na University of 
Pennsylvania. Seu mentor foi o eminente estruturalista Zellig Harris, que 
o influenciou a perseguir teorias formais das línguas naturais (cf. $3.1). 
Defendida em 1951, sua tese de mestrado Morphophonemics of modern 
Hebrew (uma elaboração de sua monografia de graduação de 1949), já se- 
meava ideias centrais que viriam a florescer depois. Embora o foco fosse a 


10. Ilustro isso com dois exemplos. Em 1956, o jovem Chomsky publicou um artigo sobre a 
hierarquia de complexidade entre linguagens formais matematicamente possíveis (conhe- 
cida como hierarquia chomskyana), o qual, juntamente com o trabalho do matemático 
Marcel-Paul Schútzenberger, propiciou o desenvolvimento dos dois Teoremas Chomsky- 
-Schiitzenherger (o da Representação e o da Enumeração), que estabeleceram as fundações 
da Teoria de Linguagens Formais baseada na Álgebra Abstrata: uma enorme inovação na 
matemática sem a qual não existiria a Ciência da Computação atual, com impacto também 
na Psicologia Evolutiva atual. Além disso, em 1984, Niels Kaj Jerne foi condecorado com 
o prêmio Nobel de medicina e fisiologia por sua pesquisa sobre o sistema imunológico, 
fortemente influenciada pelas ideias de Chomsky em teoria gramatical. 

1. cf. http://news.mit.edu/1992/citation-0415 

12. Nada tenho a dizer obre isso, pois o escopo deste livro é a visão chomskyana de língua/ 
gramática; além de eu não ser especialista em teoria sociopolítica. Aliás, digo uma coisa 
importantíssima: as visões chomskyanas de linguagem e de política são independentes, ha- 
vendo quem endosse efusivamente uma delas rejeitando veementemente a outra; e muitos 
têm opiniões fortes sobre uma, mantendo-se agnósticos em relação à outra. 
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morfofonologia, já se delineava uma concepção de organização da gramá- 
tica como um todo: uma teoria geral da linguagem (baseada em níveis de 
representação e regras de reescritura), na qual se formulam teorias de gra- 
máticas de línguas particulares. Em sua tese de doutorado, Transformatio- 
nal analysis, de 1955, Chomsky desenvolve a noção de transformação como 
um tipo de regra necessário para a construção de sentenças. Mais que isso, 
transformação seria um nível de análise gramatical, tal como fonologia, 
morfologia e estrutura sintagmática. Isso difere significativamente do que 
se entendia na época por “transformação” segundo o próprio Harris (cf. 
Chomsky 1979: 119-124). Essa tese foi parte de um projeto maior no 
qual Chomsky se inseria, de 1951 a 1955, como membro do grupo Har- 
vard Society of Fellows. O produto completo da pesquisa se materializou 
entre 1955 e 1956 na clássica e revolucionária obra The logical structure 
of linguistic theory (publicada quase integralmente apenas em 1975"): a 
pedra fundamental da GGT, lamentavelmente pouco lida. Ali estão muitos 
fundamentos da GGT, a maioria dos quais são válidos até hoje e são de 
crucial importância para se compreender a fase mais recente do paradig- 
ma chomskyano (i.e. o Programa Minimalista), que em parte bebeu na 
fonte das suas origens primeiras. 

Na primeira década da GGT, Chomsky publicou obras de grande im- 
pacto nos estudos de lógica e ciência da computação (cf. n. 10): Systems of 
syntactic analysis (1953), Logical syntax and semantics: their linguistic rele- 
vance (1955), Semantic considerations in grammar (1955), Three models for 
the description of language (1956), Finite state languages (1958, coautor: G. 
Miller), On certain formal properties of grammars (1959), A note on phra- 
se structure grammars (1959), Some methodological remarks on generative 
grammar (1961), On the notion “rule of grammar' (1961), A transformational 


13. Neste livro, citarei esta obra como Chomsky (1955a) fazendo referência à data do ma- 
nuscrito para melhor situá-la no contexto histórico da GGT. Entretanto, permito-me a 
“heresia” de remeter à paginação da versão publicada 20 anos depois (Chomsky 1975a), que 
é muito mais acessível, e cuja formatação é bem mais legível. 
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approach to syntax (1962), Explanatory models in linguistics (1962), Context- 
-free grammars and pushdown storage (1962), Formal properties of grammar 
(1963), The algebraic theory of context-free languages (1963, coautor: M-P. 
Schiitzenberger), Introduction to the formal analysis of natural languages e 
Finitary models of language users (ambos de 1963, coautor: G. Miller). O im- 
pacto disso tudo na linguística não foi imediato, nem foi proporcional à en- 
vergadura das ideias ali propostas e sua relevância para a teoria gramatical, 
Foi a publicação do despretencioso livro Syntactic structures, em 1957, que 
alavancou o desenvolvimento da GGT enquanto abordagem frutifera dos 
estudos gramaticais. Aquele modelo se distinguia das abordagens de então 
pela explicitude de seu formalismo matemático aplicado a uma base empíri- 
ca complexa", Segundo esse formalismo, há sentenças formadas a partir de 
outras (proto)sentenças”. Além disso, parte da morfologia era incorporada 
à própria sintaxe, cujas regras combinavam raízes e flexões, num modelo 
integrado de morfossintaxe, prevendo uma morfofonolologia que lida com 
supleções, itens sincategoremáticos e alomorfias (cf. $3.5). 

Em 1959, Chomsky publica sua resenha do livro Verbal behavior de B.F. 
Skinner (1957), demonstrando ponto a ponto os equívocos daquela em- 
preitada científica, O impacto disso nos estudos de psicologia da linguagem 
humana foi enorme. Embora a teoria comportamentalista skinneriana não 
tenha acabado ali (mesmo a crítica chomskyana sendo suficientemente for- 
te para gerar tal efeito), o fato é que aquela abordagem para a linguagem 
nunca vingou (cf. Chomsky 1982b: 16-18), crucialmente porque Chomsky 
demonstrou que ela era inviável conceitual e empiricamente (cf. Lemle 
2001, para uma ótima explanação). 


14. Chomsky não foi o primeiro a dar um tratamento matematicamente formalizado para 
gramáticas das línguas naturais. Yehoshua Bar-Hillel, seu contemporâneo e interlocutor, 
fazia isso a seu modo. Duas décadas antes, Kazimierz Ajdukievicz já havia formulado o pri- 
meiro modelo de Gramática Categorial. O relativo pioneirismo de Chomsky nesse sentido 
reside na amplitude e complexidade da base empírica investigada, para a época. 

15. E.g. Gru adotou Agnes e Agnes foi adotada por Gru seriam geradas, via transformações, 
a partir de uma mesma estrutura básica comum (o chamado kernel, distinto da estrutura 
profunda proposta em 1965). 
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Ao fim da primeira década da GGT, a despeito de avanços importan- 
tes, poucos eram os pesquisadores dedicados a ela. Isso começou a mudar 
drasticamente no início da segunda década. Em 1964, Chomsky publica 
Current issues in linguistic theory, um clássico em que as principais premis- 
sas teórico-metodológicas da GGT são explicitadas. Em 1965, ele publica 
Aspects of the theory of syntax, em que, com base na obra anterior, o forma- 
lismo é revisado substancialmente. É somente aí que surgem os conceitos 
de Estrutura Profunda e Estrutura Superficial: duas estruturas sintáticas de 
uma mesma sentença. À primeira (que determina a semântica) aplicam-se 
transformações que geram a segunda (refletida na fonologia). Mantém-se 
as transformações singulares e abandonam-se as transformações generaliza- 
das (cf. $3.2), que seriam resgatadas três décadas depois. A partir daí, o 
encaixamento de sentenças dentro de sentenças'* passa a ser tratado via 
regras sintagmáticas e não via transformações que fundem sentenças in- 
dependentes. Nesse momento, questões sobre a realidade psicológica da 
linguagem (sobretudo relativas à aquisição de linguagem) passam a ocupar 
o centro das discussões, e a hipótese de uma Gramática Universal inata ga- 
nha força. No contexto desse modelo, Chomsky e o fonólogo Morris Halle 
publicam, em 1968, The sound pattern of English, que estabeleceu o ponto 
de referência ao qual toda a teorização fonológica até hoje se refere, seja 
para lapidar as ideias ali propostas, seja para contestá-las. 

Consolidou-se aí a Teoria Padrão, que, reformulada num empreendi- 
mento coletivo”, se verteu na Teoria Padrão Estendida. Outras obras-cha- 
ve de Chomsky desse período são: Cartesian linguistics (1966), Topics in 
the theory of generative grammar (1966), Recent contributions to the theory 


16. E.g. |* Erin sabe [* que Cassie disse [* que Janice mostrou [* que Karen provou [* que 
Anita mentiu)])]] 

17. São tantos os autores importantes que é impossível listá-los todos. Mas penso que seria 
injusto não destacar aqui o nome do sintaticista John Robert Ross, que'movimentou! como 
ninguém a GGT nas décadas de 1960 e 1970, seja elaborando e corroborando as ideias de 
Chomsky, seja confrontando-as contundentemente. Acrescento ainda o nome do filósofo 
Jerry Fodor, que ergueu as bases conceituais sobre as quais se sustenta boa parte da visão 
chomskyana da relação entre linguagem e pensamento, e entre mente e cérebro. 
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ofinnate ideas (1967), Some general properties of phonological rules (1967), 
Language and mind (1968), Remarks on nominalization (1970), Deep 
structure, surface structure and semantic interpretation (1970), Problems 
of knowledge and freedom (1971), Some empirical issues in the theory of 
transformational grammar (1972), Conditions on transformations (1973), 
In response to 'Deep language” (1973), Reflections on language (1975), Ques- 
tions of form and interpretation (1975), Conditions on rules of grammar 
(1976), On the nature of language (1976), On WH movement (1977), Fil- 
ters and control (1977, coautor: H. Lasnik), A remark on contraction (1978, 
coautor: H. Lasnik), Language and responsibility (1979), Rules and repre- 
sentations (1980), e On binding (1980). 

Em todo esse período da Teoria Padrão (Estendida), entre as muitas 
reformulações e disputas internas e externas, destacam-se muitos debates 
acirrados travados entre Chomsky e dissidentes (].R. Ross, P. Postal, G. La- 
koff e J. McCawley), proponentes da Semântica Gerativa (SG), que se opu- 
nham à visão chomskyana de uma semântica interpretativa que lê a Estru- 
tura Profunda, produto da sintaxe gerativa. Para Chomsky, a sintaxe seria 
em larga medida autônoma e independente da semântica, que calcularia 
o significado de acordo com estruturas determinadas sintaticamente. Os 
proponentes da SG, por outro lado, defendiam que as estruturações se- 
mânticas tinham um impacto decisivo na sintaxe. Essa foi uma época de 
ouro em que os críticos de Chomsky eram ótimos descobridores de novos 
padrões e de contraexemplos para padrões previamente estabelecidos. A 
despeito de certas teimosias e farpas de ambos os lados, foi um período 
muito fértil da teoria gramatical (cf. Harris 1993). Ao fim, Chomsky de- 
monstrou que a SG era insustentável como teoria geral da gramática. Ainda 
que o fato de os proponentes da SG terem abandonado o modelo não seja 
prova cabal disso, também é fato que eles não responderam às objeções de 
Chomsky! Isso tampouco significa que Chomsky tenha vencido o deba- 


18. Huck & Goldsmith (1995: 79-89) veem o fim da SG em termos sociológicos, fruto de 
fatores externos, como dispersão de grupo: tese contundentemente rebatida por Newmeyer 
(1996: 127-137). 


26 


te por completo. A versão específica de semântica interpretativa da Teoria 
Padrão Estendida também se mostrou inviável, motivando a proposta do 
nível de representação Forma Lógica no modelo seguinte (cf. $4.3, $4.4.3). 

Ainda nesse período, houve o famoso debate sobre linguagem e 
aprendizagem entre Jean Piaget e Noam Chomsky, ocorrido na Abadia 
de Royaumont em 1975. Piaget defendia a posição de que aquisição de 
linguagem é apenas uma instância particular da nossa capacidade cognitiva 
geral de aprendizagem. Chomsky afirmou que Piaget não oferecia efetiva- 
mente teoria de aprendizagem alguma, e apresentou evidências empíricas e 
argumentos lógicos para a posição de que a aquisição de linguagem difere 
fundamentalmente de outros exemplos de reconhecimento de padrões, e 
que as crianças humanas possuem uma Gramática Universal inata que as 
guia na tarefa específica de internalizar uma língua. Esse debate contou 
com a participação de diversos intelectuais importantes (dentre os quais 
se destacaram os filósofos Jerry Fodor e Hilary Putnam, respectivamente 
favorável e desfavorável à posição chomskyana). Toda a discussão foi pu- 
blicada em 1979 e 1980 (edições francesa e norte-americana, respectiva- 
mente) num volume editado pelo biólogo Massimo Piattelli-Palmarini, o 
organizador do evento. As contribuições de Chomsky (e de Fodor) naquele 
volume também são “leitura obrigatória”, pois muito do que se apresenta 
hoje como argumento contra ou a favor do inatismo gramatical já estava 
posto naquele debate sob alguma forma. 

O marco da fase seguinte da obra chomskyana é seu livro Lectures on 
government and binding (1981), que é a culminação de reflexões desenvol- 
vidas nos anos anteriores. Isso inaugurou o Modelo de Princípios e Parâme- 
tros (P&P), apelidado de Teoria de Regência e Ligação (TRL) em referência 
àquela obra seminal. O modelo P&P foi motivado por questões relativas à 
necessidade de precisar os limites da variação e da invariância entre línguas 
particulares. Se a teoria geral da gramática for rígida ou flexível demais, 
prevê erroneamente que as línguas particulares não diferem nada entre si 
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ou que elas podem ser ilimitadamente diferentes. Isso se relaciona à aquisi- 
ção de linguagem. Quais mecanismos gramaticais são de fato inatos e quais 
não são? Além disso, o modelo P&P foi uma proposta de reorganizar as 
regras e os princípios da gramática, de modo que construções específicas 
(e.g. “voz passiva) “oração subordinada adjetiva restritiva) etc.) são vistas 
como efeitos colaterais da interação da aplicação de regras gerais de uma 
gramática composta de módulos interdependentes que interagem entre si, 
não havendo nada como a regra de construção de passiva, por exemplo. 

Consolidou-se então uma nova abordagem para o significado. No mo- 
delo P&P, a Estrutura Profunda (uma interface com o léxico) codifica 
a parte básica do significado. Aspectos mais complexos são codificados 
num terceiro nível sintático (e não semântico): a Forma Lógica". Obras- 
-chave de Chomsky desse período são”: Markedness and core grammar 
(1981), Principles and parameters in syntactic theory (1981), Some con- 
cepts and consequences of the theory of government and binding (1982), 
On the generative enterprise (1982), Modular approaches to the study of 
the mind (1984), Knowledge of language: its nature, origin and use (1986), 
Barriers (1986), Language and problems of knowledge (1988), On formali- 
zation and formal linguistics (1990), Some notes on economy of derivation 
and representation (1991), Linguistics and adjacent fields: a personal view 
(1991), Language and thought (1993), e The principles and parameters 
theory (1993, coautor: H. Lasnik). 

Em A minimalist program for linguistic theory (1993), Chomsky fez um 
balanço dos sucessos e fracassos da TRL, e concluiu que o saldo era positi- 
vo. No curto espaço da década anterior houve avanços sem precedentes no 
acúmulo de generalizações empíricas sobre padrões gramaticais universais 
e particulares. Avançou-se muito no desenvolvimento de um sistema formal 


19. Saliento que a Forma Lógica é uma estrutura sintática, não uma estrutura semântica 
(cf $4,3 e $4.4). 

20. Evidentemente, também nessa fase a contribuição de diversos outros autores foi funda- 
mental. Novamente, é impossível apresentar uma lista justa. 
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unificado para as diversas línguas. Mas o aparato técnico necessário para tal 
tarefa acabou “inchado; e muitas supostas 'explicações' mais pareciam des- 
crições moldadas numa metalinguagem com um excesso de ferramentas 
de natureza axiomática. Assim como houve o momento em que a Teoria 
Padrão precisou ser estendida, aquele era o momento de a TRL ser reduzida. 
Aquelas alturas, o modelo P&P previa, para toda sentença, quatro níveis de 
representação: Estrutura Profunda, Estrutura Superficial, Forma Fonética 
e Forma Lógica. Apenas os dois últimos são conceptualmente necessários, 
pois fazem interface com os sistemas de som e significado, imprescindíveis. 
Os dois primeiros são justificados apenas por assunções internas à teoria. É 
certo que toda expressão linguística (atômica ou complexa) é, no mínimo, 
uma conexão entre som e significado. Logo, qualquer teoria precisa, no mí- 
nimo, conceber, para cada sentença, uma estrutura legível pelos processos 
cognitivos que lidam com som, e outra legível pelos processos psicomoto- 
res que lidam com significado. 

A aposta é que esse mínimo é o máximo. A gramática não teria níveis 
internos de estrutura, apenas os que fazem interface com sistemas extra- 
gramaticais (por hipótese: um para o som (ou gestos), outro para o signifi- 
cado). Nascia aí o Programa Minimalista (PM), cuja primeira encarnação 
completa foi o livro The minimalist program (1995). O objetivo era reter os 
ganhos da TRL, corrigindo seus problemas via um enxugamento do apara- 
to formal, reduzindo-o ao mínimo necessário. Não se trata simplesmente 
de descartar a parte ruim e conservar a boa. É preciso reformular o todo, e, 
antes disso, diagnosticar adequadamente o que é necessário e o que é exces- 
sivo. O PM não é uma teoria ou um modelo. É um conjunto de diretrizes 
para se formular teorias/modelos mais genuinamente explicativos. Todas 
as condições de boa formação de estrutura se seguiriam ou de demandas 
das interfaces — tomadas como condições de legibilidade — ou de princípios 
de economia derivacional do 'sistema computacional” construtor de estru- 
tura. À gramática só teria mecanismos conceptualmente necessários para 
construir, de forma ótima (i.e. com um mínimo de custo computacional), 
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estruturas interpretáveis pelos sistemas de desempenho, o que propicia no- 
vas linhas de investigação a nível neurofisiológico e evolutivo. 

Outras obras-chave desse período são: Language and nature (1995), 
Bare phrase structure (1995), Some observations on economy in generative 
grammar (1998), Minimalist inquiries: the framework (2000), New hori- 
zons in the study of language and mind (2000), Derivation by phase (2001), 
The faculty of language: what is it, who has it, and how did it evolve? (2002, 
coautores: M. Hauser e T. Fitch), On nature and language (2002), Beyond 
explanatory adequacy (2004), Three factors in language design (2005), The 
evolution of the language faculty: clarifications and implications (2005, coau- 
tores: T. Fitch e M. Hauser), Of minds and language (2007), Approaching UG 
from below (2007), Biolinguistic explorations: design, development, evolution 
(2007), On phases (2008), Poverty of stimulus revisited (2011, coautores: R. 
Berwick, P. Pietroski e B. Yankama), Language and other cognitive systems: 
what is special about language? (2011), The science of language (2012), Po- 
verty of the stimulus stands: why recent challenges fail (2012, coautores R. 
Berwick e M. Piattelli-Palmarini) Problems of projection (2013), The mys- 
tery of language evolution (2014, coautores: M. Hauser, C. Yang, R. Berwick, 
1. Tattersall, M. Ryan, J, Wattumull e R. Lewontin), Science, mind, and 
limits of understanding (2014), Some core contested concepts (2015), What 
kind of creatures are we? (2015), e Why only us: language and evolution 
(2016, coautor: R. Berwick). 
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$2. O Olhar Chomskyano 
sobre os Fatos Gramaticais 


52.1. (IN)ACEITABILIDADE & (AJGRAMATICALIDADE 


Tomemos os exemplos (la) e (1b) abaixo. Ambos são arranjos admis- 
síveis de itens lexicais (ILs) na “nossa língua” Cada IL é uma expressão lin- 
guística atômica (uma “unidade saussureana significante-significado)'. O 
arranjo (la) é reconhecido e aceito pelos falantes como uma sentença da 
língua (uma expressão linguística complexa); enquanto (1b) não o é. 


(la) &Y A fada despiu o robô no hangar. (1b) 9* Hangar robô fada o a no despiu. 


Embora (la) seja inusitado e inédito, é potencialmente dizível e com- 
preensível num contexto apropriado. Sua forma é familiar, comum a vá- 
rias sentenças que já dissemos ou escutamos, como A menina beijou o 
namorado no cinema. Indico tal aceitabilidade pelo simbolo “&, Logo, é 
natural supor que (la) obedece às regras combinatórias da gramática da lín- 
gua, sendo portanto gramatical. Indico essa suposta gramaticalidade por*Y”. 


1. Dado que o léxico é, grosso modo, o vocabulário da língua) cada IL seria um vocábulo. Por 
ora, restringindo-nos à sintaxe, tomemos IL como equivalente a palavra, ainda que, a rigor, 
palavras não sejam unidades atômicas, mas combinações complexas de morfemas (e.g. 
desp-i-u), estes sim itens lexicais (signos). 


Em contraste, (1b) nos parece apenas uma sequência aleatória de ILs que 
não é dizivel e/ou compreensível em contexto algum. Indico tal inaceitabi- 
lidade por “?, Isso naturalmente nos faz supor que (1b) não é um produ- 
to possível das regras combinatórias da gramática. Indica-se essa supos- 
ta agramaticalidade por “*. É crucial distinguir entre (in aceitabilidade e 
(a)gramaticalidade (cf. Chomsky 1965: 10-15). A primeira é fruto de uma 
reação concreta e observável do falante-ouvinte a um arranjo particular 
de ILs, logo: um dado factual bruto. A segunda é uma conclusão a que o 
linguista chega a partir de juízos de aceitabilidade somados a outros aspec- 
tos teórico-analítico-metodológicos, que o levam a inferir que as regras da 
gramática são tais que legitimam certos arranjos e não outros, num plano 
mais abstrato que aquele do uso efetivo da língua, que é influenciado por 
fatores extragramaticais, como memória, atenção, expectativa, etc. Logo, 
(a)gramaticalidade é um construto teórico, que, como tal, é sujeito a ques- 
tionamento (por isso eu falei acima em suposta (a)gramaticalidade). Mas 
não é um “mero chute. É sempre uma hipótese testável e testada, obtida por 
comparação entre vários dados. A rigor, não há juízo de (a)gramaticalida- 
de, apenas juízo de (in)aceitabilidade. 

A partir de casos simples como (1), é tentador pensar que todo arranjo 
aceitável é aceitável por ser gramatical, i.e. todo arranjo gramatical seria 
necessariamente aceitável. Inversamente, todo arranjo inaceitável só seria 
inaceitável por ser agramatical, i.e. tudo que é agramatical seria inaceitável. 
Mas a realidade é mais complexa. A seguir, adoto a convenção acima quan- 
to ao uso dos símbolos “é, *, Y, *; sendo a omissão do simbolo de (in) 
aceitabilidade um indicativo de que o dado é aceitável, enquanto a omis- 
são do símbolo de (a)gramaticalidade indica que o dado é gramatical”. A 


2. Na literatura técnica, encontramos tipicamente “** para os exemplos 'ruins, ausência de 
marcação para os “bons; e “” para os casos duvidosos. Infelizmente, não há consistência 
total entre os autores quanto a essa indicação de “bom ou ruim” se referir a (in)aceitabili- 
dade ou (a)gramaticalidade. Nos primeiros textos, Chomsky não usava marcação alguma é 
explicitava o estatuto de (in Jaceitabilidade/(a )gramaticalidade no corpo do texto. 
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concepção de (in)aceitabilidade e (a)gramaticalidade em termos binários 
('tudo ou nada”) é antes uma opção metodológica (justificável, mas não 
necessária nem inquestionável) que uma premissa dogmática da GGT. 
Ambas as dimensões podem ser tidas como graduais/escalares, o que não 
viola as premissas da GGT, ao contrário do que muitos pensam”. Chomsky 
(1965: 11) defendia que “[tJal como a aceitabilidade, a gramaticalidade é, 
sem dúvida, uma questão de grau [...], mas as escalas de gramaticalidade e 
aceitabilidade não coincidem. A gramaticalidade é só um de muitos fatores 
que interagem para determinar a aceitabilidade”. Inicio a discussão pelos 
famosos exemplos abaixo (cf. Chomsky 1955a: 94-95, 145, 1956: 116, 1957: 
15, 196 1a: 224, 230, 1965: 149)*. 


(2a) *Y' Ideias verdes incolores dormem furiosamente. (Colorless green ideas sleep furiously) 


(2b) ** Furiosamente verdes dormem incolores ideias. 


3, As origens da ideia de graus de gramaticalidade estão em Chomsky (1955a: 129-155; 
1957: cap 5, n. 2,7; 1961a: 233-239; 1962b: 178; 1965: 148-153). Com o tempo, Chomsky 
mostrou-se mais agnóstico quanto a isso, formulando análises em termos de (a)gra- 
maticalidade binária por default, sem descartar explicitamente o inverso. O tema divide 
opiniões entre os praticantes da GGT, mas a maioria tem concebido o sistema em termos 
de (a)gramaticalidade binária, seja por opção metodológica (deixando aberta a possibi- 
lidade da gradualidade), seja por convicção. Há propostas recentes de implementação 
concreta de um modelo de gramática em que a (a)gramaticalidade é gradual (e.g. Hayes 
2000). Em contraste, Hornstein (2015d) frisa que, embora a (a)gramaticalidade gradual 
seja uma possibilidade a ser considerada, ela não se segue logicamente da gradualidade 
da (in)aceitabilidade. Pode-se ter (a)gramaticalidade binária, sendo a (in )aceitabilida- 
de gradual por motivos de desempenho. Segundo ele, ainda não há evidências robustas 
para (a)gramaticalidade gradual. 

4. Esse dado é menos original do que se costuma pensar. Em 1953, Lucien Tesniêre já havia 
inventado Le silence vertébral indispose la voile licite (= O silêncio vertebral incomodou 
a-vela lícita) para argumentar a favor da autonomia da sintaxe em relação à semântica e 
à morfologia. Antes, em 1940, Bertrand Russel inventara Quadruplicity drinks procrasti- 
nation (= A quadruplicidade bebe a procrastinação). Em 1925 e 1953, respectivamente, já 
haviam sido criados os jogos Cadavre Exquis e Mad Libs, através dos quais várias sentenças 
nonsense” podem ser geradas para fins lúdicos. 
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Diante da flagrante estranheza de (2a), a reação mais comum é tomá-lo 
como inaceitável; e ficamos tentados a considerá-lo agramatical. Na com- 
paração, percebemos que (2b) é ainda mais estranho. O contraste fica mais 
claro se comparamos os pares em (2) e em (3). Fica evidente que ambos 
os pares instanciam os mesmos padrões (i) Nome” Adjetivo” Adjetivo" Ver- 
bo"Advérbio e (ii) Advérbio" Adjetivo"Verbo” Adjetivo" Nome. 


(3a) & Atletas profissionais desempregados sofrem intensamente. 
(3b) ?* Intensamente profissonais sofrem desempregados atletas. 


Ou seja, (3a) seria uma sentença totalmente bem-formada. (2b) e (3b) 
seriam sintaticamente malformadas, logo não sentenças. (2a) seria tão sin- 
taticamente bem-formada quanto (3a), por serem idênticas nesse nível, 
mas seria nonsense, aparentemente violando algum princípio semântico”. 
Os julgamentos de (in)aceitabilidade sobre o par em (3) são robustos, si- 
milarmente a (1). Quanto ao par em (2), alguns rejeitam categoricamente 
(2a), tanto quanto (1b). Outros, embora vejam certa estranheza em (2a), 
percebem algo muito 'familiar/regular” em sua forma, e aceitam-no, mes- 
mo sem compará-lo a (2b) ou (3a). Os primeiros falantes levam mais em 
conta o significado para julgar (2a). Os do segundo grupo julgam (2a) mais 
pela sintaxe. Crucialmente, os do primeiro grupo, mesmo rejeitando (2a), 
reconhecem um contraste claro entre (2a) e (2b), bem como os paralelos 
entre (2a) e (3a), e entre (2b) e (3b). 


5. Chomsky (1957: cap 2) não o rotulava como inaceitável, mas como nonsense. Chomsky 
(1965; cap 4) o classifica entre as expressões com grau baixo de agramaticalidade (cf. n. 15). 
Comento isso em $4.5 adiante. 

6.Jakobson (1959) afirma que (2a) não seria nonsense, desde que vários de seus ILs sejam 
tomados metaforicamente. Exemplos concretos disso estão nos poemas Colorless Green 
Ideas Sleep Furiously, de Dell Hymes, e Coiled Alizarine, de John Hollander. Isso, no entanto, 
em nada afeta o argumento original. Chomsky (1957: 16) antecipou essa crítica, observan- 
do que a constatação de que (2a) tem o potencial de ser utilizável num contexto extraor- 
dinário não se estende para (2b), o que só evidencia o paralelo entre (2a)/(2b) e (3a)/(3b). 
Em Chomsky (1961a: 230-235), esse ponto é elaborado em detalhe, numa resposta direta a 
Jakobson (1959). 
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A (in)aceitabilidade de (2a) varia conforme o falante e as circunstân- 
cias”. O que diz a GGT sobre isso? E quanto à (a)gramaticalidade, como 
classificar (2a)? É comum rotularem-no de “inaceitável e gramatical, Mas 
isso depende do nosso olhar teórico sobre a reação de estranheza do falan- 
te, ainda que ela fosse invariável. Numa visão possível, seria gramatical ape- 
nas um dado linguístico “perfeito”: totalmente bem-formado em todos os 
planos (lexical, fonológico, morfológico, sintático, semântico). Assim, pa- 
rece coerente classificar (2a) como agramatical. Alternativamente, pode-se 
conceber um dado como gramatical ou agramatical a depender do que se 
analisa. Por exemplo, se um estrangeiro pronuncia (la) com sotaque forte, 
violando regras fonológicas da língua, estaria produzindo algo agramatical 
naquele plano, porém gramatical nos outros. Vista dessa forma, a noção de 
(a)gramaticalidade seria relativa ao plano em questão (lexical, fonológico, 
morfológico, sintático, semântico). Consequentemente, (2a) seria gramati- 
cal em todos os aspectos, exceto o semântico (elaborarei sobre isso adian- 
te). Sob essa ótica, a gradualidade da (a)gramaticalidade seria inevitável”. 

Essa relativização se coloca de modo ainda mais acentuado para a (in) 
aceitabilidade. Segundo Chomsky (1957: 92), “[0] processo de 'compreen- 
der uma sentença” pode ser explicado, em parte, utilizando-se a noção de 
nível linguístico”, Conforme a sensibilidade do falante-ouvinte para cada 
plano de estrutura gramatical no processamento de um enunciado em 


7.A confiabilidade dos juízos de aceitabilidade depende do método com o qual os coleta- 
mos (cf. $2.4). 


8. Ainda que eventualmente sejamos capazes de compreendê-lo, devido a um processo 
mental de traduzir aquilo para a nossa gramática com base em pistas contextuais, o que 
pode ser mais fácil, mais dificil, ou impossível. 

9. Essa não é a única maneira de se conceber gramaticalidade em termos graduais. Mesmo 
restringindo-nos à sintaxe, poderiamos ou não, a depender do referencial teórico, falar em 
graus de gramaticalidade entre (i) Ele abriu a caixa vermelha; (ii) Ele abriu a vermelha 
caixa; e (iii) Vermelha ele caixa a abriu; conforme o número e o tipo de regras sintáticas 
violadas/obedecidas. Pode-se, ainda, conceber regras gramaticais como estabelecendo uma 
escala de opções melhores ou piores para combinações de partes menores em maiores. 
Grosso modo, seria como se certos tipos de combinações obtivessem da gramática “nota 9,5” 
ou'nota 3,5 (cf. n. 15). 
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tempo real, (2a) pode ser aceitável ou não. É evidente que o grau de aceita- 
bilidade reflete em grande medida o grau de gramaticalidade. Tendemos a 
aceitar o que é gramatical e a rejeitar o que não é. Aquilo que segue padrões 
que usamos em nossa comunicação diária tende a nos parecer mais fami- 
liar; e o que não os segue nos seria mais estranho”. Mas isso não é tudo. 
Como acabamos de ver, a nossa percepção e consciência metalinguística 
pode não acessar todos os componentes da gramática de modo uniforme. 
Além disso, há outros fatores sutis e intrincados. Comecemos pelos mais 
simples. Observe os dados em (4). 


(4a) & YA capital do Brasil é Curitiba. 

(4b) &Y Eu moro em Curitiba. 

(4c) & Max mora na melhor cidade da América do Sul. 
(4d) &YO Lobo Mau atacou as casas dos Três Porquinhos. 


Claramente, (4a) veicula uma infomação falsa. Mas a gramática é indife- 
rente a isso. Temos aí algo gramaticalmente bem-formado e totalmente 
aceitável enquanto sentença da língua, ainda que isso não nos informe acu- 
radamente sobre o mundo em que vivemos. Se aceitabilidade e gramatica- 
lidade dependessem do vínculo com a verdade, discursos ficcionais seriam 
impossíveis (ou seriam não linguísticos). A linguagem permite mentir, 
criar ficção, ou veicular informação falsa por engano. A propósito, a sen- 
tença (4b) é verdadeira? Depende de quem a enuncia, e em que circuns- 
tâncias. Se eu digo isso hoje, digo a verdade. Se eu dissesse isso em 1989, 
seria uma inverdade. Dito por várias pessoas mundo afora, isso não é nem 
nunca foi verdadeiro. Logo, sentenças, elas mesmas, não são verdadeiras 


10. Pondo-se de lado “expressões congeladas, memorizadas como um todo, reconhecida- 


mente não produtivas, como: O amor que tu me tinhas era pouco e se acabou; Ei-lo porque 
qui-lo; e Eilho de peixe peixinho é. 
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nem falsas". O que é verdadeiro ou falso é um enunciado particular de 
uma sentença relativamente ao contexto da enunciação (quem fala, para 
quem se fala, quando e onde se fala, etc.). Que tal (4c)? Considerando que 
Max se refere a este autor que lhes fala, eu considero isso verdadeiro. Muitos 
discordam dessa minha impressão subjetiva e consideram que a melhor 
cidade da América do Sul é outra, o que tornaria (4c) falso. Há verdades 
que são relativas. Por fim, considere (4d). Não hesitamos em tomar isso 
como verdade, embora isso seja mais fantasioso que (4a). No mundo em 
que vivemos, não há lobos falantes nem porcos construtores de casas. E daí? 
Os enunciados não são interpretados em relação ao “mundo real”, que ma- 
joritariamente desconhecemos, mas sim em relação a um “mundo possível” 
(cf. Borges Neto 2007), seja ele uma fantasia em que optamos por acreditar 
para apreciar a arte, seja ele algo que — acertando ou errando — acreditamos 
corresponder fielmente ao 'mundo real, embora nunca possamos ter total 
certeza (conforme nos ensina o Mito da Caverna de Platão). 

Por que gasto tanto papel e tinta com truísmos sobre a inexistência de 
relação entre gramática e verdade? Na medida em que a (a)gramaticali- 
dade é estabelecida parcialmente a partir de juízos de (in)aceitabilidade, é 
preciso, ao coletar tais juízos, certificar-se de que o falante não rejeita certos 


11. Num futuro hipotético, um enunciado de (4a) poderia ser verdadeiro. Trocando-se 
Curitiba por Rio de Janeiro ou Salvador, temos enunciados que são falsos hoje, mas que já 
foram verdadeiros em épocas passadas. 

12. O fato de a boa formação semântica de um enunciado de uma sentença não depender 
da verdade do conteúdo proposicional ali expresso não é incompatível com a amplamente 
aceita assunção de Tarski (1944, 1956) de que conhecer o significado de (um enunciado de) 
uma sentença é conhecer as suas condições de verdade. Um enunciado da sentença declara- 
tiva Lola corre é verdadeiro se e somente se Lola corre, e falso em contrário. O enunciado 
de Lola corre é uma asserção de que as suas condições de verdade estão sendo satisfeitas. As 
sentenças interrogativas são menos triviais. Por ora, é suficiente dizer que em Lola corre? 
temos uma solicitação ao interlocutor para que ele informe se tais condições de verdade 
estão sendo satisfeitas ou não. Em Quem corre?, temos a pressuposição de que é verdadeiro 
quealguém corre, e a solicitação pela informação acerca da identidade dessa pessoa. Quan- 
do se enuncia a sentença imperativa Corra, Lola, corra!, tem-se um apelo para que Lola 
faça o necessário para que as condições de verdade de Lola corre passem a ser satisfeitas. 
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dados por motivos dessa ordem, já que muitas vezes submetemos ao julga- 
mento dos falantes exemplos complexos que veiculam informações fanta- 
siosas, que só são plausíveis em contextos extraordinários. É preciso ter um 
método de coleta capaz de minimizar “falsos positivos" e “falsos negativos, 
como veremos adiante (cf. $2.4). No limite, isso se aplicaria também a (2a), 
que, como já apontara Jakobson (1959: 495), pode ser visto como uma sen- 
tença semanticamente bem-formada independentemente de qualquer metá- 
fora. Sob essa ótica, (2a) seria tão somente falsa, se interpretada de acordo 
com o nosso mundo de referência ordinário (cf. Chomsky (1964: 7-8, n.2) 
para uma posição contrária). 

Vejamos agora casos mais interessantes, e que ajudam a entender a afir- 
mação de Chomsky (1957: 15) de que “qualquer procura por uma definição 
de 'gramaticalidade' baseada em noções semânticas será fútil”. Os exemplos 
abaixo estão marcados com “??, sinalizando uma dúvida inicial dupla com 
respeito à (in)aceitabilidade e à (a)gramaticalidade. 


(5a) 2? A menina comeu uma pizza amanhã. 

(5b) 22 A menina comeu um helicóptero na cozinha. 

(5c) 22 A menina sorriu um helicóptero na cozinha. 

(5d) ?? O constrangimento sorriu um helicóptero amanhã. 
(5e) 22 A tova gimblou o borogovo no wabe. 

(5f) 2? Wabe tova borogovo o a no gimblou. 


À primeira vista, (5a) parece ser sintaticamente bem-formado (estrutu- 
ralmente, é análogo a (la)), mas semanticamente malformado. Teria (5a), 
então, o mesmo estatuto de (2a)? Sua aparente anomalia semântica residi- 
ria numa incompatibilidade entre o ato de comer ter ocorrido no passado 
(como indica a flexão verbal) e no futuro (como indica o advérbio ama- 
nhã). Embora seja possível formular uma teoria semântica que atribua a 
(5a) o estatuto de malformado nesse plano, isso parece desnecessário e, no 
limite, até problemático. O que há de ilógico em se conceber um evento 
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ocorrido no passado, mais precisamente num ponto específico do passado 
situado após o presente? O absurdo disso não reside na (falta de) lógica, 
mas no fato de que, no mundo em que vivemos, o tempo é linear, e um 
evento não pode se situar antes e depois do presente. Por que a semântica 
deveria se restringir aos limites desse nosso mundo (tal como o percebe- 
mos)? E se enunciarmos (5a) numa história de ficção científica em que a 
menina acabou de retornar de uma viagem no tempo, na qual ela viajou 
para o futuro, comeu uma pizza, e retornou ao presente? Portanto, há bons 
motivos para considerarmos que (5a) é semanticamente bem-estruturado, 
embora necessite de condições de enunciação extraordinárias para ser dis- 
cursivamente eficaz. 

E quanto a (5b)? Por mais absurdo que seja uma pessoa comer um heli- 
cóptero, nada nos impede de veicular essa ideia fantasiosa através de (5b), 
sobretudo num conto de ficção no qual a menina é uma gigante de outro 
mundo, ou no qual o helicóptero foi triturado e a menina o comeu aos 
pedacinhos, demoradamente”. Novamente, temos algo semanticamente 
normal, mas que só cabe num discurso instanciado num contexto anor- 
mal. E que tal (5c)? Sua estrutura sintática parece ser análoga à de (5a), de 
(5b), e, crucialmente, de (1a). E quanto ao significado? Há um contraste 
entre (5b) e (5c). O significado do verbo transitivo comeu pressupõe a 
existência de algo a ser comido (uma pizza, um helicóptero, etc.), o que 
força a existência, na sintaxe, de um objeto direto. Por outro lado, sorriu 
é intransitivo, não comportando ser combinado com um objeto. Logo, há 
uma anomalia séria em (5c). Se ela é sintática ou semântica, isso depen- 
de da ontologia das relações entre predicadores e seus argumentos (que 
determinam, entre outras coisas, a transitividade de verbos). No quadro 


13. É irrelevante que helicóptero possa ser o apelido de uma comida, ou se referir a um 
doce em forma de mini-helicóptero. Isso nos remeteria a um ponto já resolvido acima (cf. 
n. 6). A propósito, embora a estranheza pragmática de (5b) seja inegável, é importante 
notar que (la) também não é nada trivial nesse aspecto. 
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da GGT, concebe-se essa relação como sendo sintaticamente representada 
via papéis temáticos", Mesmo assim, temos razões para afirmar que (5c) é 
agramatical, diferentemente de (5a) e (5b)”. Uma versão aparentemente 
mais extrema dessa anomalia seria (5d), em que o sujeito de sorriu não se 
refere a um ente capaz de sorrir, além da coexistência entre amanhã e um 
verbo no passado. Porém, esses problemas são da mesma ordem daqueles 
em (5a) e (5b). Logo, (5d) seria apenas tão agramatical quanto (5c), em- 
bora seja bem mais inaceitável. 

O dado (5e) é claramente nonsense. Seria ele, pois, semanticamente mal- 
formado? Sua estrutura gramatical é construída toda a partir de elementos 
que majoritariamente não são ILs da “língua”. Logo, não há significados 
das partes a partir dos quais se possa construir o significado do todo. Inte- 
ressantemente, a despeito da anomalia no plano lexical e consequente nuli- 
dade semântica, temos uma estrutura bem-formada nos planos fonológico, 
morfológico e sintático. Aliás, mesmo desconhecendo os significados de 
tova, borogovo, wabe e gimblar (que sabemos serem três nomes e um ver- 
bo, respectivamente, a partir das dicas da estrutura morfossintática), não 
hesitamos em tomar o significado de (5e) como a asserção de que houve no 
passado um ato de 'gimblação” praticado pela tova, afetando o borogovo, 
tendo isso ocorrido no wabe. Como se pode 'saber' uma porção do signi- 
ficado do todo mesmo sendo as raízes nominais e verbais sem significado? 


14.A subparte da GGT (desenvolvida a partir de Chomsky (1981a: 34-48) ) que trata disso é 
a Teoria Temática (cf. $4,4.2, adiante). No resto desta seção, simplifico bastante as questões 
relativas a papéis temáticos, ignorando exemplos e potenciais contraexemplos que seriam 
relevantes, bem como outros papéis temáticos como experienciador e tema. Para um apro- 
fundamento, cf. Williams (1994) e Pietroski (2005). 


15. Antes do surgimento da Teoria Temática (cf. n. 14), 0 contraste entre (5b) e (5c) era 
concebido em termos de graus de agramaticalidade, tal que (5b) viola requerimentos (hie- 
rarquicamente mais baixos) de seleção lexical, enquanto (5c) viola requerimentos (hierar- 
quicamente mais altos) de subcategorização (cf. Chomsky 1965: 75-79, 148-153), ambos ope- 
rando na interface entre léxico e sintaxe (cf. $4.5). 

16. Esse tipo de exemplo, utilizado em psicolinguística experimental, é nomeado de Jabber- 
wocky, a partir do poema homônimo de Lewis Carroll, incluso no romance Through the 
Looking Glass, and What Alice Found There. 


Segundo a GGT, isso decorre do fato de os papéis temáticos (grosso modo, 
relações como agente e paciente de um evento) serem codificados sintati- 
camente (cf. $4.2.2). Se tais relações fossem codificadas lexicalmente, não 
teriamos como prever que é impossível interpretar (5e) tomando-se a tova 
como paciente e o borogovo como agente. Por fim, (5f) é indubitavelmente 
inaceitável e agramatical, menos por ser construído a partir dos mesmos 
“ingredientes estranhos” de (5e), e mais por claramente ferir as regras sintá- 
ticas familiares da língua” Tal contraste é análogo ao que vimos acima entre 
(2a) e (2b) e entre (3a) e (3b). 

Como se vê, as noções de (in)aceitabilidade e (a)gramaticalidade não 
são triviais, mas é possível distingui-las. Agora, deixemos de lado as estra- 
nhezas semântico-pragmáticas e apreciemos agora estranhezas puramente 
sintáticas em exemplos nos quais entendemos muito bem o que se quer 
dizer e que não pode ser dito da forma como está colocado. 


(6a)&Y Léo alertou você [que Zé espionava Cris). 
(6b)+Y Quem, (que) Léo alertou você [que Zé espionava O] ? 
(7a)éY Léo alertou você [enquanto Zé espionava Cris). 


(7b)9* Quem, (que) Léo alertou você [enquanto Zé espionava O]? 


Em (6a) temos a sentença subordinada que Zé espionava Cris como 
o segundo objeto do verbo alertou. A aceitabilidade de (6b) indica que o 


objeto do verbo dessa subordinada pode ser realizado como um pronome 
interrogativo deslocado de sua posição canônica para o início da senten- 
ça principal. (7a) se parece muito com (6a). Porém, em (7a), a sentença 
subordinada não é objeto de alertou — cujo segundo objeto direto, nesse 
caso, é subentendido: i.e. o interlocutor foi alertado “sobre alguma coisa! 
[Elnquanto Zé espionava Cris é uma subordinada na função de adjunto de 
alertou, e expressa circunstância de tempo. Espera-se que o deslocamento 
do objeto de espionava seja possível também em (7b), tal como é em (6b). 
Surpreendentemente, não é. (7b) é claramente inaceitável. Dada a seme- 
Ihança aparente com (6b), pode-se pensar que, sintaticamente, não há nada 
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de agramatical em (7b), que seria inaceitável por algum motivo ainda a ser 
identificado. De acordo com as análises da GGT, (7b) é agramatical, dife- 
rentemente de (6b), posto se tratarem de dois tipos distintos de subordi- 
nação, e as regras sobre o deslocamento de elementos interrogativos serem 
sensíveis a tal diferença. Evidentemente, isso não é óbvio e demanda uma 
argumentação mais detalhada (cf. $2.6, $5.5, $5.6). Por ora, note que, de 
um ponto de vista estritamente semântico, não há diferença relevante entre 
(6b) e (7b): uma corresponde a “Eu solicito que você me revele a identidade 
da pessoa x, tal que Léo alertou você que Zé espionava x”; a outra corres- 
ponde a “Eu solicito que você me revele a identidade da pessoa x, tal que 
Léo alertou você enquanto Zé espionava x”. Acima, vimos dados semanti- 
camente estranhos, mas sintaticamente perfeitos. Agora, vemos que (7b) é 
semanticamente irretocável, mas mesmo assim é inaceitável. Por quê? Não 
havendo má-formação nos planos lexical, fonológico e morfológico, res- 
ta-nos capitalizar na diferença sintática entre as subordinadas (uma com- 
plemento do verbo, outra seu adjunto), e buscar aí uma explicação para o 
contraste de gramaticalidade. Esclareço isso adiante (cf. $2.2, $2.6). Consi- 
deremos agora o par em (8): 


(8a)?/0 rato que o gato que o cão que o homem adestrou mordeu perseguiu 
comeu o queijo. 

(8b)&/O homem adestrou o cão que mordeu o gato que perseguiu o rato que 
comeu o queijo. 


De saída, (8a) soa incompreensível, com uma sintaxe nada corriqueira 
(quatro verbos principais em sequência!). Sem dúvida, (8a) é inaceitável. 
Mas é gramatical? Voltarei a esse ponto. Por sua vez, (8b) é facilmente in- 
terpretável e soa familiar, apesar de ser mais longa que o habitual (por suas 
múltiplas subordinações). Comparando atentamente as duas, percebemos 
que (8a) “pretende dizer algo próximo de (8b), e que também é formada 
por múltiplas sentenças subordinadas (do mesmo tipo: adjunto adnomi- 
nal) recursivamente encaixadas dentro de um 'grupo nominal. A diferença 
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básica entre (8a) e (8b) é que o fato de as múltiplas subordinadas estarem 
no sujeito ou no objeto. Será que as regras sintáticas proíbem uma coisa e 
permitem a outra? De acordo com as análises da GGT, ambas seriam gra- 
maticais, mas (8a) seria inaceitável por motivos extragramaticais (cf. van 
der Hulst 2010b: xxiv-xexiv). 

O ônus da prova recai sobre os chomskyanos, que afirmam a gramatica- 
lidade de (8a) a despeito de sua flagrante inaceitabilidade. Por ora, simples- 
mente chamo atenção para o fato de que, no âmbito da sintaxe, qualquer 
tentativa de permitir as múltiplas subordinações dentro do objeto e proibi- 
-las dentro do sujeito não é nada trivial. Tomemos o “grupo nominal” iso- 
lado [a aluna]. Nada impede que se encaixe nele uma subordinada, como 
em (i) [a aluna [que elogiou o professor]] ou em (ii) [a aluna [que o pro- 
fessor elogiou]). Ambas as estruturas derivadas podem ser sujeito de uma 
sentença maior, como (iii) A aluna que elogiou o professor leu o livro ou 
(iv) A aluna que o professor elogiou leu o livro. Em (iii), o sujeito contém 
uma subordinada dentro da qual há um objeto que se qualifica como um 
“grupo nominal" em princípio elegível para ser submetido à mesma regra 
de encaixe/adjunção de uma nova subordinada (e.g. [a aluna [que elogiou 
o professor [que (...)]]]). Em (iv), há essencialmente o mesmo, diferindo 
quanto ao fato de que, dentro da subordinada encaixada/adjungida ao su- 
jeito da sentença principal, o grupo nominal elegível para hospedar uma 
nova subordinada é um outro sujeito. Em suma, tudo indica que qualquer 
“grupo nominal) independentemente de sua função sintática, pode hospe- 
dar uma subordinada desse tipo. 

Embora não possamos dogmaticamente descartar qualquer tentativa de 
formular uma teoria que preveja um contraste de (a)gramaticalidade entre 
(8a) e (8b), vemos, de saída, o quão complexa essa sintaxe teria de ser. As 
análises de GGT, ao atribuírem a inaceitabilidade de (8a) a algo extragra- 
matical, capitalizam na distinção entre competência e desempenho, a qual, 
como veremos em breve (cf. $2.2), não é um mero apelo a uma noção for- 
jada ad hoc para “tapar o buraco" daquilo que não se conseguiu explicar. Ao 
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contrário, é a solução mais simples e eficaz possível, baseada numa distin- 
ção inexoravelmente inerente a todo empreendimento científico genuíno. 

Passemos agora aos dados do inglês em (9) (cf. Fults & Phillips 2004, 
Wellwood et al. 2015, e obras lá referenciadas): 


(9a)&* More people have been to Russia than I have. 
mais pessoas tinham ido à Rússia do-que eu tinha 

(9b)%* More people have been to Russia than 1 have been to Rússia. 
mais pessoas tinham ido à Rússia do-que eu tinha ido à Rússia 


Sistematicamente, os falantes aceitam (9a). Seria esse dado gramatical? Se- 
gundo as análises da GGT, não. A expressão descontínua more N [..] than 
Lu] (mais N [...] do que [...]) pede a presença de dois conjuntos 'do mes- 
mo tipo” para compará-los quanto ao número de membros de cada um. Se, 
em vez de (9a), tivéssemos More people have been to Russia than dogs have 
(aceitável e, ao que tudo indica, gramatical), a comparação se dá entre nú- 
mero de pessoas que foram à Rússia e o número de cachorros que também 
foram à Rússia. Não temos isso em (9a). De um lado, teríamos o conjunto de 
pessoas que foram à Rússia; do outro, teriamos o conjunto de eventos em que 
o enunciador teria ido à Rússia (expresso por [ have). Trata-se, pois, de uma 
comparação entre incomensuráveis, o que fica evidente quando analisamos 
(9b), claramente inaceitável (e, ao que tudo indica, agramatical, pelo motivo 
ora exposto)”, Aparentemente, haveria uma relação entre (9a) e (9b), seme- 
lhante ao que temos entre (i) They have been to Russia more than [ have, e 
(ii) They have been to Russia more than 1 have been to Russia; em que (i) é 
analisável como uma versão de (ii) sobre a qual teria sido aplicada uma regra 
opcional de elipse do material que se segue o verbo auxiliar have". 


17. Nessas comparações, os sujeitos de ambas as cláusulas devem ser nominais plurais nus 
(i.e. nomes sem artigos e afins). A sequência More people have been to Russia than ("the 
dogs have é agramatical com o artigo e gramatical sem ele (cf. Wellwood et al. 2015: $1.1). 
O pronome L em (9a) não é um nominal plural nu. 

18. Grosso modo, os equivalentes em português de (i) e (ii) são, respectivamente, Eles foram 
à Rússia mais do que eu, e Eles foram à Rússia mais do que eu fui à Rússia. 


A existência de pares como (i) e (ii) aparentemente contribui para a 
ilusão de que o mesmo ocorreria entre (9a) e (9b), que pareceriam ser am- 
bas gramaticais. Se o dado (9a) fosse gramatical, seu significado seria algo 
como “O número de pessoas que foram à Rússia é maior do que o número 
de vezes em que eu fui à Rússia”, Porém, os mesmos falantes que aceitam 
(9a) quando solicitados a julgá-lo à queima-roupa admitem não o inter- 
pretar dessa forma. Mais que isso, admitem não conseguir atribuir signi- 
ficado algum a (9a), o que corrobora a ideia de que more N [...] than [...] 
deve comparar o tamanho” de conjuntos do mesmo tipo. Vemos, então, em 
(9a), o exato oposto do que vimos em (8a). Enquanto (8a) é inaceitável e 
gramatical, (9a) é aceitável e agramatical. Em ambos os casos, (in Jaceita- 
bilidade e (a)gramaticalidade não coincidem de estar ambas no mesmo 
polo (positivo ou negativo), devido a uma ilusão de (a)gramaticalidade, 
induzida por fatores extragramaticais operantes na percepção e no proces- 
samento, em tempo real, da linguagem. Fenômenos semelhantes abundam 
em outros domínios da cognição, como no famoso exemplo de ilusão de 
ótica em (10). Dois segmentos reta com igual comprimento são percebi- 
dos como tendo comprimentos diferentes devido à presença das setas nas 
extremidades, apontando para dentro ou para fora. E a ilusão se mantém 
mesmo após efetuarmos as devidas medições (cf. Fodor 1984: 32-34, 40). 


(10))—————+< 
€<—————» 


Por fim, vejamos um último tipo de não paralelismo entre (in Jaceitabi- 


(ilusão Lyell-Múller, cf. Hoffman 1998) 


lidade e (a)gramaticalidade, denominado efeito de melhoramento (cf. Bo- 
linger 1978, Kayne 1983). 


(11aJê Akemi guardou os brinquedos na gaveta. 
( Ib)tY Quem, (que) O, guardou o qué, na gaveta? 
(11c)9O que, (que) quem, guardou (2, na gaveta? 
(11d que, (que) quem, guardou O, onde ? 


4s 


Não há controvérsia quanto a (1a) ser aceitável e gramatical. O mesmo 
vale para (11b), em que, havendo dois pronomes interrogativos em princí- 
pio deslocáveis para o início da pergunta, aquele que efetivamente se des- 
loca é o sujeito do verbo, não o objeto (cf. $3.5, $3.7). (11c) não é aceita 
pelos falantes, a despeito de o sentido pretendido ser claro (essencialmente 
o mesmo de (1 1b)). De acordo com as análises da GGT, (1 1c) seria agrama- 
tical por violar um requerimento de localidade de deslocamento, segundo 
o qual, havendo dois candidatos equivalentes a serem deslocados, o que de 
fato pode ser deslocado é aquele cuja posição de partida é mais próxima da 
posição de chegada (cf. Chomsky 1973a, Rizzi 1990). Surpreendentemente, 
para muitos falantes — não todos — (11d) é mais aceitável que (1 1c), embora 
ambos apresentem a mesma violação do requerimento de localidade, com 
o objeto se deslocando para o início, 'passando por cima” do sujeito". Ao 
que tudo indica, esse efeito de melhoramento é desencadeado pela presen- 
ça de um terceiro pronome interrogativo, onde, que, a rigor, entraria na 
competição como o elemento mais distante e, portanto, menos deslocável: 
o que torna o movimento de o qué menos ruim que um potencial mo- 
vimento de onde. O estatuto de (in)aceitabilidade de (11d) varia com as 
circunstâncias, podendo se aproximar mais de (11b) ou (11c). Seu estatuto 
de (a)gramaticalidade é controverso, dependendo dos detalhes do modelo 
analítico de referência. Mas, em última instância, trata-se de uma questão 
empírica (i.e. que se decide observando os fatos), conforme o grau de erro 
ou acerto das previsões que cada modelo faz para exemplos análogos. 

Para análises mais profundas e atualizadas das discrepâncias entre (in) 
aceitabilidade e (a)gramaticalidade, numa perspectiva integrada a outros 
aspectos da cognição, sugiro ao leitor Schiitze (1996), Boeckx (2010: cap 9), 
Lewis & Phillips (2015) e Uriagereka (2015). 


19. Fedorenko & Gibson (2010), Gibson et al. (2011) e Gibson & Fedorenko (2013) contes- 
tam a premissa de que (1 1d) seria mais aceitável que (11c). Uriagereka (2015) propõe uma 
ousada abordagem unificada desse e de outros efeitos de melhoramento, em termos de sus- 
pensão de agramaticalidade, que seria uma instância particular, no âmbito do desempenho 
linguístico, do processo cognitivo mais geral de suspensão de descrença. 
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52.2. COMPETÊNCIA & DESEMPENHO 


Julgamentos de (in)aceitabilidade refletem parcialmente a capacidade de 
reconhecer a (a)gramaticalidade de quaisquer arranjos de ILs”. Por isso, 
embora sejam coisas distintas (o que é evidenciado pelos exemplos em (8a) 
e (9a) acima), há uma tendência geral para aceitarmos o que é gramatical 
e rejeitarmos o que é agramatical. Porém, não somos infalíveis nessa tarefa 
de classificação, assim como não somos infalíveis em geral. Para tudo, há 
uma diferença entre 'saber fazer” e 'conseguir fazer o que se sabe” Por exem- 
plo, você é capaz de erguer os braços e fazer o movimento de abre e fecha 
das mãos 15 vezes seguidas? Claro que é, já que você sabe contar e sabe 
movimentar seus braços e mãos. Você é capaz de executar esse movimento 
repetitivo 45 vezes seguidas com os braços sempre erguidos? Cansa, mas é 
possível. E que tal mil vezes seguidas? Impossível. Mas o fato de você não 
conseguir fazê-lo não significa que você não sabe fazê-lo. Fatores externos 
(basicamente, fadiga muscular) lhe impedem de desempenhar bem aquilo 
que você tem competência para fazer. Os diferentes graus de desempenho 
não refletem necessariamente diferentes graus de competência. O mesmo 
ocorre com nossa capacidade de processar operações gramaticais”, 

Retomemos os exemplos (8a) e (8b) acima, agora analisando-os com au- 
xílio de exemplos adicionais, que nos ajudam a entender as estruturas em 
questão, que os praticantes da GGT tomam como gramaticais, a despeito da 


20. Por ora, estou tacitamente tomando IL como equivalente a palavra, o que é uma grande 
simplificação (cf. n. 1). Ressalto, desde já, que as mesmas questões de (in)aceitabilidade e 
(a)gramaticalidade também se colocam nos planos fonológico e morfológico. Por exemplo, 
Y[fleh] é uma sequência de fones lícita para formar uma sílaba (cf. flerte), mas *[lhef) 
não o é. Do mesmo modo, Y des-tranc-á-vel é uma sequência de morfemas lícita, mas 
*vel-tranc-a-des não o é. Em ambos os casos, temos “sintaxe” lato sensu; regras determi- 
nando combinações possíveis e impossíveis de elementos atômicos para formar arranjos 
mais complexos. 

21.Chomsky (1975b: cap 1) elabora o conceito de capacidade cognitiva; e Chomsky (1980a: 
59; 1986a: 40; 1988: 24) esclarece que toma competência como estado mental, e não como 
habilidade. 
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diferença de aceitabilidade. Através da série em (12), comecemos por disse- 
car (8b), que é plenamente aceitável. 


(122) homem adestrou [** o cão] 

(12b)5/0 homem adestrou [** o cão [* que mordeu [** o gato]]] 

(129)+/0 homem adestrou [“* o cão [* que mordeu [** o gato [* que perseguiu 
[o rato])]]] 

(129)+/0 homem adestrou [** o cão [* que mordeu [* o gato [* que perseguiu 
[o rato [* que comeu [** o queijo]])]]]] 


Em (12a) temos o objeto direto simples o cão, apresentado entre colchetes 
e rotulado como SN (sintagma nominal), por ser um agrupamento de ILs 
cujo núcleo é o nome (substantivo) ção, e cujos demais elementos (no caso, 
9) expressam informações adicionais sobre a entidade expressa pelo nome. 
Pode-se construir, a partir de (12a), o exemplo ligeiramente mais complexo 
O homem adestrou [“ o cão feroz], no qual se acrescenta ao SN o adjetivo 
feroz, que expressa um atributo do cão. O que temos em (12b) é algo bem 
parecido, porém a característica atribuída ao cão (i.e. a de ter mordido o 
gato) é expressa por uma sentença subordinada (que os gramáticos nor- 
mativistas classificam como 'adjetiva;, porque ela ocupa o mesmo espaço de 
um adjetivo dentro de um SN), a saber: que mordeu [* o gato]. Dentro 
dessa sentença subordinada, há outro SN: o gato. Logo, não surpreende que 
esse SN também seja elegível para hospedar uma outra oração subordi- 
nada adjetiva. É exatamente isso que temos em (12c), que, por sua vez, traz 
um novo SN, o rato, que, em (12d (=8b)), tem uma sentença subordinada 
combinada a si. Apliquemos o mesmo raciocínio a (8a), com o auxílio dos 
exemplos em (13), que, a esse ponto, devem ser autoexplicativos. 


(13a)8Y |“ o rato] comeu o queijo. 

(13b)8v [** o rato [5 que ["* o gato] perseguiu]] comeu o queijo. 

(39 [N o rato [* que [* o gato [5 que [** o cão] mordeu] perseguiu]]] comeu o 
queijo. 

(13d)$Y[* o rato [* que [** o gato [* que [** o cão [* que [*“ o homem] adestrou]) 
mordeu] perseguiu]]] comeu o queijo. 
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Tipicamente, (13a) e (13b) são julgados como aceitáveis, e (13c) e (13d 
(=8a)) como inaceitáveis. Esse ponto de corte pode variar entre pessoas, 
ou uma mesma pessoa pode apresentar julgamentos que variam conforme 
as circustâncias: grau de atenção, presença ou não de pausa logo após cada 
um dos blocos marcados em negrito, velocidade da fala, disponibilidade de 
tempo para pensar diante do exemplo escrito, etc. No limite, embora o dado 
(13d) continue sendo inaceitável, a exposição a essa demonstração passo a 
passo (não presente no uso típico da língua) nos faz vê-lo como menos 
inaceitável, por nos darmos conta do fato de que a sua estrutura é forma- 
da pelo mesmiíssimo mecanismo gramatical de subordinação presente em 
(12d). Se a gramática não permitisse acoplar uma “sentença subordinada 
adjetiva”a um SN em função de sujeito, então nem mesmo o dado (13b) 
seria aceitável, mas ele o é. Se a regra de subordinação pode afetar qualquer 
SN, seja ele sujeito ou objeto, então prevemos que tanto (12d (=8b)) como 
(13d (=8a)) devem ser gramaticais. 

Que fatores extragramaticais, então, seriam responsáveis pelo contras- 
te de aceitabilidade entre (12d (=8b)) e (13d (=8a))? Em suma, tudo se 
reduz a uma questão de memória de curto prazo no processamento da 
sentença em tempo real. (13d (=8a)) sobrecarrega o buffer (i.e. memória 
de curto prazo), mas (12d (=8b)) não (cf. Miller & Chomsky 1963). Em 
ambos os casos, temos quatro ações: adestrou, mordeu, perseguiu e comeu, 
cujos agentes são, respectivamente: o homem, o cão, o gato e o rato; e cujos 
pacientes são, respectivamente: o cão, O gato, O rato e o queijo. Assim, o 
conteúdo informacional das sentenças é praticamente o mesmo (diferindo 
quanto ao “ponto de vista) ao que se coloca em primeiro ou em segundo 
plano), mas as partes estão organizadas sintaticamente de modos diferen- 
tes, causando uma diferença no processamento em tempo real, em relação 
ao estabelecimento/reconhecimento das relações de agente de e paciente de 
com respeito à ação expressa por cada verbo. Abaixo, adoto a convenção de 
expressar a relação X é agente da ação Y por uma seta padrão, e a relação o 
paciente da ação Y é Z por uma seta tracejada. 
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(14a) O homem adestrou o cão que mordeu o gato que perseguiu o rato que comeu o queijo. 


| | 


TC 
1 ' 1 Y 


O rato que o gato que o cão que o homem adestrou mordeu perseguiu comeu o queijo. 


LAS 1 1 


No plano puramente sintático, abstraindo o tempo de fala, temos as 


mesmas relações em ambas as sentenças. Mas há uma grande diferença no 
estabelecimento/reconhecimento dessas relações em tempo real em virtude 
das diferentes disposições lineares dos elementos que entram nessas rela- 
ções. Em (14a), o fluxo da informação não é interrompido. A busca pelo es- 
tabelecimento de cada nova relação é iniciada sempre após a consolidação 
de uma relação anteriormente estabelecida. Não há necessidade de reter 
nenhuma das informações por muito tempo na memória de curto prazo 
enquanto outras informações são processadas. Em (14b), algo bem diferen- 
te ocorre. O processador primeiro registra o rato, estocando-o na memória 
enquanto processa outras informações. É preciso aguardar bastante para 
relacionar o rato a comeu. Enquanto isso, o processador registra o gato, 
estocando-o na memória; fazendo depois o mesmo com o cão e o homem. 
Após isso, são estabelecidas as relações o homem é o adestrador e o adestrado 
éo cão. Daí em diante, o estabelecimento das outras relações demanda que 
todos os elementos “soltos” estejam “frescos na memória de curto prazo, 
com suas ordens de aparição devidamente registradas. Em condições típi- 
cas de fala em tempo real, isso não funciona, pois o buffer foi sobrecarre- 
gado. Quando se chega a mordeu, já não se consegue mais relacioná-lo a o 
gato, dada a distância entre os dois e o tanto de material intervindo entre 
eles. Mais dificil ainda é depois relacionar perseguiu a o rato, e o rato a co- 
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meu, para finalmente relacionar comeu a o queijo. Em suma, não há nada 
de agramatical com esse exemplo, mas a imensa dificuldade em usá-lo em 
tempo real o torna inaceitável”. 

Ironicamente, o fator “memória de curto prazo escassa) responsável pela 
inaceitabilidade de dados gramaticais, também pode ter um efeito inverso. 
Como reportam Gibson & Thomas (1999) e Vasishth et al. (2010), dados 
agramaticais semelhantes a (15) costumam ser considerados mais aceitá- 
veis que (14b), aproximando-se de (14a) em aceitabilidade, ainda que não 
gozem de aceitabilidade plena. 


(15) 2 rato que o gato que o cão mordeu fugiu rapidamente. 


É como se a subsequência o gato (ou 9 rato) estivesse sobrando, fosse 
uma intrusão indevida na sequência gramatical O rato que o cão mordeu 
fugiu rapidamente (ou O gato que o cão mordeu fugiu rapidamente). No 
decorrer do processamento, quando se chega a mordeu, após o rato, o gato, 
e o cão, os limites da memória fazem o falante-ouvinte “esquecer uma des- 
sas partes, julgando só a parte da sequência que está ativa na memória. 

O exemplo anterior de dado aceitável e agramatical apresentado em (9a) 
é mais complexo, e demandaria uma discussão mais longa na qual eu teria 
que pressupor certos conhecimentos do leitor (ver discussão nas obras ci- 
tadas acima). Por ora, é suficiente dizer que fatores extragramaticais oriun- 
dos dos processos cognitivos de percepção e analogia “pregam uma peça" no 
falante-ouvinte, que não percebe a anomalia da estrutura agramatical (em 
que os termos da comparação são sintática e semanticamente de tipos di- 
ferentes), que acaba passando despercebida, por sua semelhança superficial 
a estruturas gramaticais. 


22. O tipo de dificuldade que (14b) impõe aos sistemas de desempenho na produção e 
compreensão, sobrecarregando a memória de curto prazo, decorre do fato de sua estrutu- 
ra conter múltiplas dependências aninhadas e autoencaixamento, no formato [a[b[c(d...d) 
clbjal. As análises contemporâneas desse fenômeno tém suas origens nos trabalhos de 
Chomsky (1956, 1959a, 1961b) e sobretudo Miller & Chomsky (1963). 
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Não há nenhuma premissa na GGT que negue que o fenômeno da lin- 
guagem verbal, como um todo, seja repleto de faces e interfaces diversas, 
tangenciando e interseccionando questões de memorização, expectativas, 
emoções, intenções, obstáculos físicos e fisiológicos, de padrões e valores 
sócio-histórico-culturais. O que se afirma é que a gramática guarda uma 
grande independência disso tudo, ainda que o produto final da linguagem 
(os enunciados e discursos) traga em si o gramatical e o extragramatical 
amalgamados (cf. Newmeyer 1983: 35-38). A competência gramatical do 
falante é uma das competências que compõem a capacidade comunicati- 
va e interacional, que incluiria também uma competência pragmática (cf. 
Chomsky 1980a: 59, 92, 206, 224-225)”. A gramática estabelece que os enun- 
ciados tenham determinadas formas e não outras. Entretanto, na prática, as 
formas e as funções dos enunciados acabam sendo determinadas por essa 
interação entre a competência gramatical e outros fatores. Na comunicação 
ordinária, sob variadas condições favoráveis ou adversas, frequentemente 
falamos e compreendemos enunciados agramaticais ou semigramaticais”, 
assim como falhamos ao tentar produzir ou interpretar enunciados de sen- 
tenças gramaticais. 

Nesse aspecto, a linguagem não difere de nossas outras habilidades e 
práticas. Por exemplo, considere um músico virtuoso que domina plena- 
mente as técnicas do piano, com plena competência para executar exem- 
plarmente todos os movimentos necessários para tocar uma peça musical 
que ensaiou exaustivamente. Não é impossível que ele, eventualmente, 
tenha um desempenho fraco num concerto, porque está com as mãos ma- 
chucadas, ou está psicologicamente abalado, ou fisicamente debilitado 
por uma doença, ou esqueceu os óculos e não enxerga bem a partitura. O 
desempenho não depende apenas da competência. Depende também das 


23.CF. Pires de Oliveira & Basso (2014) para uma concepção consistente da noção de com- 
petência pragmática. 


24. E.g. *Ouviram do Ipiranga as margens plácidas de um povo heroico o brado re- 
tumbante. 
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circunstâncias, que, se muito adversas, podem fazer o mais competente 
dos competentes ter um desempenho de um amador. Inversamente, consi- 
dere um atleta de tiro ao alvo amador, inexperiente e com pouca técnica. 
Se ele competir “dopado” com fármacos que diminuam bastante sua fre- 
quência cardíaca, ele contará com um tempo muito maior que o normal 
entre uma batida cardíaca e outra para planejar e executar seu tiro sem 
o risco de um “microssolavanco' afetar a precisão milimétrica de seu tiro. 
Consequentemente, ele pode vir a ter um desempenho de campeão, que 
excede em muito a sua competência medíocre. 

Em linhas gerais, a dicotomia competência/desempenho é basicamente 
isso, algo trivial, atestado em diversas atividades humanas sob outras for- 
mas. Essa dicotomia é chave para compreender outros conceitos funda- 
mentais relativos à definição do objeto de estudo da GGT (e da linguística 
em geral), seu método, seu arcabouço conceitual, e a legitimidade de sua 
base empírica, para então fazer avaliações e tirar conclusões. Por fim, devo 
frisar que, por mais legítima e inexorável que seja a separação entre com- 
petência e desempenho, muitas vezes a demarcação da fronteira é difícil de 
estabelecer; havendo espaço para divergências pontuais mesmo no âmbito 
da GGT (cf. Chesi & Moro 2015). Essa é uma questão empírica. Mas ques- 
tões empíricas não se resolvem apenas observando os dados empíricos, 
pois eles não se apresentam portando rótulos como 'eu sou desencadeado 
por fatores de desempenho" ou “eu sou consequência natural da aplicação 
das regras da competência! A resolução de questões empíricas, além da 
observação atenta aos detalhes dos dados, também requer análises minu- 
ciosas e comparativas de muitos dados diferentes, e avaliação de hipóteses 
concorrentes que diferem apenas minimamente quanto a suas previsões. 
Não se pode, por exemplo, excluir dogmaticamente a priori uma tentativa 
de explicar contrastes do tipo (14a) e (14b) exclusivamente em termos da 
competência. Igualmente, não se pode desconsiderar de saída a possibi- 
lidade de explicar o contraste entre (2a) e (2b) puramente em termos de 
desempenho. A língua é o que ela é. Cabe a nós descobrir o que é que ela é. 
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52.3.0 FALANTE-OUVINTE IDEAL PAIRA ACIMA DO BEM E 
DO MAL? 


Numa de suas obras mais influentes, em que se explicitam as diretrizes 
gerais da GGT, Chomsky (1965: 3) faz uma afirmação que — para qualquer 
um que entende minimamente como a ciência funciona — é trivial, singela, 
truística; mas que desde então tem sido profundamente incompreendida, 
despertando a ira de muitos pesquisadores e estudantes: 


A teoria linguística tem como objeto um falante-ouvinte ideal, situado numa 
comunidade de fala completamente homogênea, que conhece sua língua perfei- 
tamente, e que, ao aplicar seu conhecimento da lingua no desempenho efetivo, 
não é afetado por condições gramaticalmente irrelevantes tais como limitações 
de memória, distrações, desvios de atenção e de interesse, e erros (ocasionais 
ou típicos). 


Por que estudaríamos as supostas propriedades de um ser ficcional ideali- 
zado? A ciência é ou não é o estudo da realidade que nos circunda? Segun- 
do Bagno (2012: 49), a concepção chomskyana de língua e linguística traria 
uma equivocadíssima “desconsideração absoluta [pelo] sujeito, [pelo] falante 
como ser historicamente situado, membro de uma sociedade, participante 
de uma cultura, dotado de vontade política e capacidade de ação e decisão”. 
Ora, como poderia alguém ignorar peremptoriamente a dimensão social da 
linguagem humana se ela só existe em sociedade, e sua função e natureza 
está exatamente na interação de indivíduos, que se influenciam mutuamente 
conforme uma complexa teia de fatores sócio-histórico-culturais? Que razão 
teríamos para abandonar o senso comum de que a língua é, por natureza, 
inexoravelmente social, e não individual? Bagno (2012: 51) extrapola: 


Com isso, a teoria chomskiana adquire um ar “místico; na medida em que — 
assim como na filosofia platônica — a língua, tal como o gerativismo a entende, 
não pertence ao mundo do sensível, do audível, do legível, mas a uma esfera 
transcendente, a um Mundo das Ideias (e é de ideia que vem ideal em “falante 
ideal") habitado pelas formas perfeitas do platonismo. 


Sobre objeções a idealizações, de modo geral, Chomsky (1979: 57-58) 
foi definitivo; 
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Oposição a idealizações é simplesmente objeção à racionalidade; é meramente 
insistir que não devemos conduzir trabalho intelectual relevante. Fenômenos 
que são complicados o suficiente para merecerem estudo geralmente envolvem 
a interação entre vários sistemas. Portanto, precisamos abstrair daí algum objeto 
de estudo, precisamos eliminar os fatores não pertinentes; ao menos se qui- 
sermos investigar algo não trivial. Nas ciências naturai nem se discute; é 
autoevidente. Nas humanidades, ainda se questiona isso. É lamentável. Quando 
trabalhamos a partir de uma idealização, talvez deixemos escapar algo su- 
perimportante. Isso é uma contingência da investigação racional que sempre 
foi bem compreendida. Não devemos nos apavorar com isso. Devemos enfrentar 
o problema e tentar lidar com ele, acomodando-nos a ele. É inevitável. Não há 
critérios simples para formular a idealização correta, exceto o critério de atingir 
resultados significativos. Se atingimos bons resultados, então temos razão para 
crer que não estamos longe de uma boa idealização. Se atingimos resultados 
melhores mudando a abordagem, então conseguimos uma idealização melhor. 
Há uma constante interação entre a definição de um dominio de pesquisa e a 
descoberta de princípios significativos. Rejeitar idealizações é pueril. 


De volta ao clássico texto de 1965, é crucial que aquela famigerada pas- 
sagem de Chomsky seja interpretada dentro de seu contexto original. Co- 
mecemos por explicitar a continuação daquele mesmo trecho (op. cit.: 4), 
frequentemente omitida pelos críticos: 


Para estudarmos o desempenho linguístico efetivo temos que considerar à 
interação de uma variedade de fatores; e a competência subjacente do falan- 
te-ouvinte é apenas um entre tantos deles. Desse ponto de vista, o estudo da 
linguagem não é diferente da investigação empírica de outros fenômenos com- 
plexos. Fazemos, portanto, uma distinção fundamental entre competência (o 
conhecimento que o falante-ouvinte possui da sua língua) e desempenho (o uso 
efetivo da língua em situações concretas). O desempenho só é um reflexo direto 
da competência no caso de vigorarem as condições ideais estabelecidas [acima]. 
Na realidade dos fatos, é óbvio que ela não pode refletir diretamente a compe- 
tência [...]. Para o linguista, assim como para a criança adquirindo a língua, o 
problema consiste em se chegar, a partir dos dados de desempenho, ao sistema 
subjacente de regras internalizado pelo falante-ouvinte e que ele põe em uso no 
desempenho real. Logo, no sentido técnico, a teoria linguística é mentalista, na 
medida em que visa descobrir uma realidade mental subjacente ao comporta- 
mento observável. 


Ou seja, o conceito de falante-ouvinte ideal só é absurdo se negarmos a 
distinção entre competência e desempenho, que já esclareci em $2.2. Sendo 
tal distinção real, é legítimo tomar apenas a competência como objeto de 
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estudo. Chomsky não ignorou a importância de se considerar também o 
desempenho, posto que ele mesmo reconhece uma conexão entre as duas 
coisas, tanto que admite que os dados do desempenho são as fontes obser- 
váveis a partir das quais se pode inferir indiretamente as propriedades da 
competência. Ele explicitamente admite que uma teoria geral da linguagem 
investigue o desempenho linguístico real. Não há qualquer desprezo ao su- 
jeito real e suas circunstâncias mentais e sociais. Há apenas um recorte de 
objeto de estudo, reconhecendo-se que a teoria gramatical não abarca o 
grande fenômeno da linguagem como um todo. Em outra obra do mesmo 
período, fica claro que “teoria linguística” na famigerada passagem equivale 
à GGT. Chomsky (1964: 7-9) afirma: 
Neste trabalho, restringirei o termo 'teoria linguística” ao sistema de hipóteses que 
diz respeito às características gerais da linguagem humana proposto na tentativa 
de explicar uma certa gama de fenômenos linguísticos. [...] O fato central que 
qualquer teoria linguística minimamente ambiciosa deve abordar é o seguinte: 
um falante maduro pode produzir uma nova sentença de sua língua na ocasião 
apropriada, e outros falantes a entenderão imediatamente, embora ela lhes seja 
igualmente nova. [..] O domínio normal da linguagem envolve não apenas a ha- 
bilidade de entender imediatamente um número indefinido de sentenças, mas 
também a habilidade de identificar sentenças desviantes e impor-lhes uma inter- 
pretação. [...] Partindo de uma exposição limitada aos dados da fala, toda pessoa 
normal desenvolveu em si uma competência plena em sua língua nativa. Tal com- 
petência pode ser representada — até um ponto por ora indeterminado — como 
um sistema de regras ao qual podemos chamar a gramática de sua língua. |.) À 
gramática é, então, um dispositivo que |...) especifica o conjunto das sentenças 
bem-formadas e atribui a cada uma delas (ao menos) uma descrição estrutural, 
Talvez devamos chamar tal dispositivo de Gramática Gerativa, para distingui-la de 


postulados descritivos que meramente apresentam inventários de elementos que 
aparecem em descrições estruturais, e suas variantes contextuais. 


Segue-se daí que o início da famigerada passagem equivale a “A Gramática 
Gerativa tem como objeto um falante-ouvinte ideal..”. O objeto de estudo 
dessa “teoria linguística” é a competência, em oposição ao desempenho (cf. 
Newmeyer 1983: 73-76). Um aspecto axial dessa competência é seu cará- 
ter gerativo, responsável pela capacidade de produção e compreensão de 
infinitas sentenças nunca antes encontradas, em oposição a uma suposta 
capacidade de classificar sentenças preexistentes (cf. $3.2). Nessa última 
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capacidade de classificar sentenças preexistentes (cf. $3.2). Nessa última 
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passagem, Chomsky reconhece que, além dessa competência gramatical 
gerativa, “o domínio normal da linguagem envolve [...) também a habili- 
dade de identificar sentenças desviantes e impó-las uma interpretação”, o 
que, adiante (op. cit.: 9), ele reconhece ser dependente de outros fatores e 
possível apenas quando tal desvio é suficientemente limitado, e feito atra- 
vés da identificação de características formais comuns às sentenças de fato 
geradas pela gramática. Reconhece-se aí uma certa flexibilidade no uso efe- 
tivo da linguagem, na conjunção entre a competência gramatical e outras 
habilidades, sob influência das circunstâncias. 

Ou seja, reconhece-se que há características concretas do desempenho 
linguístico sem as quais o fenômeno da comunicação verbal seria impossí- 
vel. Reconhece-se a existência de falantes-ouvintes reais, dotados de com- 
petências de vários tipos, e cujo desempenho corresponde aos dados empí- 
ricos brutos: juízos de aceitabilidade, enunciados efetivamente produzidos 
e compreendidos, de modo mais prototipicamente gramatical ou desvian- 
te. Faz-se, no entanto, um recorte teórico para a definição do objeto de es- 
tudo, justificando-o amplamente. Por fim, apreciemos o que diz Chomsky 
(1962a: 531) sobre esse recorte: 


Está claro, de saída, que a gramática formalizada, tomada como uma teoria pre- 
ditiva, é uma idealização em ao menos dois aspectos: primeiro, por considerar a 
estrutura formal independentemente do uso; segundo, porque os seus produtos 
não são os enunciados que compõem o discurso de fato, mas sim aquilo que 
falantes nativos sabem ser sentenças bem-formadas, sem terem sido ensinados. 
O discurso de fato consiste de fragmentos interrompidos, falsos inícios, lapsos, 
fala embolada, e outros fenômenos que só podem ser entendidos como distor- 
ções de um padrão idealizado subjacente. Seria absurdo tentar incorporar esses 
fenômenos diretamente numa gramática formalizada. A fala real é claramente 
um processo complexo no qual muitos fatores interagentes exercem papéis, e 
nem todos cabem no escopo dos estudos gramaticais. 


Para Chomsky, absurdo não é estudar a interação de múltiplos fatores 
na formação do discurso real. Absurdo é empreender tal investigação 
como parte da construção de uma gramática formalizada e idealizada”. 


25.CH. $2.8, adiante, sobre a inclusão de uma linha de investigação na GGT relativa ao uso 
efetivo da linguagem. 
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Como se justificam essa idealização e essa separação, se, na prática, sem- 
pre observamos tudo amalgamado? Retomo a famigerada passagem: “o 
estudo da linguagem não é diferente da investigação empírica de outros 
fenômenos complexos”, Toda e qualquer investigação científica envolve 
abstrações, recortes, idealizações, sem os quais não chegaríamos a lugar 
algum, pois rejeitá-las implica a “missão impossível” de levar tudo em 
conta”, Dizer que o objeto de estudo é o falante-ouvinte ideal equivale 
a dizer que o objeto de estudo é a competência do falante, sua gramática 
mental, enquanto conhecimento de um sistema de regras combinatórias, 
uma capacidade, uma potencialidade que, nos termos de Bagno (op. cit.), 
“transcende o sensível'”. 

No mundo real, não se pode observar a competência isoladamente, sem 
a interferência de efeitos do desempenho. Aplicam-se os métodos científi- 
cos usuais para isolar variáveis e testar hipóteses (cf. $2.2). As limitações de 
memória, vieses emocionais, etc., causam efeitos que muito nos revelam 
sobre o uso da linguagem, mas não sobre a estrutura do conhecimento gra- 
matical. A idealização metodológica do conceito de falante-ouvinte ideal 
diz respeito apenas ao desempenho (i.e. idealiza-se um falante-ouvinte com 
memória infinita, sem fadiga, etc.), e não à competência (ou seja, o objeto 


26. A própria separação do que cabe à linguística (e não à antropologia, ou psicologia, etc.) 
estudar é um recorte, sem o qual não existiram a linguística, a antropologia, a psicologia, 
etc.; apenas uma fracassada “teoria de tudo” 

27. Bagno (2012: 37-79) foge de “idealizações platônicas” e alega “implodir a caverna [do 
mito de Platão”. Mas idealizações são inexoráveis e existem na alternativa que ele, mesmo 
incipiente e ingenuamente, propõe. Seu arcabouço conceitual pós-moderno constitui-se de 
abstrações e idealizações que transcendem o sensível (e.g. yin-yang, nebulosa, lexicogramá- 
tica, emergência, dialogismo, monismo materialista). Mesmo definindo seus conceitos em 
termos de um continuum, ele não escapa da noção de protótipo, que lhe permite operar com 
idealizações como adjetivo, sintagma, paradigma, etc., das quais cada evento observável é só 
um exemplar imperfeito. Classificações discretas (forma/substância, competência/desem- 
penho, significante/significado, etc.) são por ele rejeitadas sem que se forneça uma alterna- 
tiva concreta que efetivamente faça previsões explícitas, testáveis e acertadas sobre os fatos 
relevantes. Para análises genuinamente científicas — racionais e embasadas — de fatos reais 
e espinhosos de gradação de noções gramaticais, cf. Fanselow et al. (2006) e Aarts (2007). 
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de estudo é a competência do falante-ouvinte real)”. A distinção entre com- 
petência e desempenho é tão simplesmente a velha e boa ciência bem-feita 
(cf. Chomsky 1975c: 304, em resposta direta a quem o acusa de misticismo) 
como vemos abaixo, a partir de Bogen & Woodward (1988) e Bogen (2009). 

Diz-se que o chumbo derrete a 327,46ºC. Na prática, é impossível obter 
sempre esse exato número nas medições de todos os eventos de derreti- 
mento de pedaços de chumbo. O que se obtém é quase isso, um pouquinho 
a mais ou a menos. É como se as propriedades físico-químicas do elemento 
chumbo determinassem que o ponto de derretimento seja 327,46ºC; mas, 
“na hora H) acaba sendo quase isso. Presumivelmente, existe sempre em 
cada caso a “maldita” interferência de algum fator que não se consegue con- 
trolar ou prever (e.g. alguma impureza no pedaço de chumbo — umas mo- 
leculinhas de outra coisa incrustadas na amostra — ou a própria margem de 
erro do termômetro utilizado, etc.). Mas, na média, obtém-se 327,46ºC, que 
é uma idealização, uma conclusão a que se chega exatamente abstraindo os 
múltiplos fatores intervenientes. Crucialmente, uma teoria físico-química 
da estrutura atômica do chumbo que preveja 327,46ºC como seu ponto de 
derretimento é incapaz de prever os muitos valores efetivamente obtidos 
nas medições dos eventos reais. 

Por analogia, pode-se dizer que essa média de 327,46ºC está para a com- 
petência, assim como os números observáveis na prática estão para os dis- 
cursos reais do desempenho. No limite, qualquer cientista age sempre como 
se estivesse teorizando sobre um fenômeno EF; mas a sua teoria, na verdade, 
não é sobre F, É sobre um outro fenômeno F”, que coincide exatamente 
com o que EF seria num mundo hipotético no qual não existissem os fatores 
intervenientes presentes no mundo real, cujo impacto nossos métodos não 
conseguem mensurar, e que estão a todo momento nos confundindo, ofus- 
cando a nossa visão, e criando a ilusão de que Fº seria F. Ou seja, no fundo, 


28. Não é apenas o desempenho que se abstrai. À já mencionada competência pragmá- 
tica — reconhecida por Chomsky (1980a) como parte da capacidade linguística global — 
ficaria fora do escopo da teoria gramatical. 
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o fenômeno que é possível tentar explicar é F”, embora se construa toda 
uma teoria concebendo F”, idealizando-o nos termos de F, como se Fº fosse 
F. Sinto frustrar, mas F não existe; o que existe é F””, Platônico? Chame 
como quiser, mas isso é inexorável”. Isso é que é ciência de verdade!" Nos 
termos de Bogen & Woodward (1988: 305-306), isso se resume à distinção 
entre dados e fenômenos. 


De acordo com uma visão bastante difundida, teorias científicas preveem e ex- 
plicam fatos acerca de “observáveis”: objetos e propriedades percebíveis pelos 
sentidos, às vezes magnificadas por instrumentos. [...) [O]s argumentos nessa 
direção pressupõem a concepção de que teorias científicas são testadas de acordo 
com suas previsões sobre o que podemos observar. [...) [E]ssa abordagem [...] é 
fundamentalmente incorreta: se [...] tomarmos “observar” como “perceber” 
então teorias científicas não preveem nem explicam fatos acerca do que observa- 
mos. Os fatos que se espera que teorias científicas típicas expliquem não são, via 
deregra, fatos acerca de observáveis. [...] Nosso argumento deriva uma impor- 
tante distinção majoritariamente ignorada nas análises tradicionais da ciência: a 
distinção entre dados e fenômenos. Dados, que exercem o papel de evidência da 
existência dos fenômenos, podem em geral ser trivialmente observados; mas da- 
dos tipicamente não podem ser previstos ou sistematicamente explicados pela 
teoria. Por outro lado, boas teorias cientificas preveem e explicam fatos acerca 
dos fenômenos. Fenômenos são detectáveis através de dados, mas em geral não 
são observáveis em nenhum sentido relevante do termo. 


Eis então o que a inexorabilidade nos reserva. Enclausurados na caverna 
estão os dados, os observáveis, o desempenho, o falante real e suas muitas 


29, Hornstein (2015c), replicando um argumento de Paul Pietroski, atenta para o fato de 
astrônomos formularem teorias de mecânica celeste baseados em visões de observatório, 
em que se vê a posição aparente dos astros, e não a real. As distorções são “filtradas' pelas 
teorias e análises, no limite do conhecimento das distorções. Essa comparação remonta a 
outra, semelhante e mais profunda, elaborada em Chomsky (1980a: 189-192). Enfim, na 
ausência de condições ideais de observação direta, fazemos o melhor uso possível do que 
nos está disponível. 


30. Obviamente, isso não significa que o cientista se contenta em estudar um mundo fictí- 
desprezando a realidade. Ao contrário, tenta-se ao máximo conhecer os fatores inter- 
venientes que nos ofuscam a visão, que nos fazem ver F" em lugar de F. Busca-se, cartesia- 
namente, chegar o mais próximo possível de F. Porém, sabe-se o quão dificil isso é, e o quão 
valiosa é uma versão aproximada de F, em comparação com a ignorância total. 


31. Remeto o leitor a Bagno (201 la: 363) para uma defesa do exato oposto, classificando 
como um “escândalo epistemológico” qualquer investigação acerca da gramática que isole 
variáveis relativas ao uso. 


circunstâncias. Fora, estão os fatos, os fenômenos, a competência, o falante 
real idealizando-se a ausência de suas circunstâncias extragramaticais. A 
GGT é uma janelinha que nos possibilita olhar para fora da caverna. Logo, 
a dicotomia competência/desempenho, assim como o conceito de falante- 
-ouvinte ideal, são lugares-comuns em ciência, e não devaneios extravagan- 
tes de Chomsky” ' *, 


52.4. A LEGITIMIDADE DA BASE EMPÍRICA DA GGT 


Aproveitando-nos da passagem de Bogen & Woodward (1988: 305-306) 
em $2.3, vejamos como Chomsky (1961a: 219) concebe a relação entre teo- 
ria e empiria na GGT. 


Éimportante, de saída, fazer uma distinção entre dados e fatos. Os dados 
do linguista consistem em certas observações sobre a forma e o uso de 
enunciados. Os fatos sobre a estrutura linguística que ele almeja des- 
cobrir vão muito além dessas observações. A gramática de uma língua 
particular é, em efeito, uma hipótese sobre os princípios de formação 
de sentenças nessa língua. Ela representa uma afirmação factual sobre 
as regras subjacentes aos dados coletados. julgamos a veracidade ou fal- 
sidade dessa hipótese avaliando o quão bem-sucedida é a gramática em 
organizar os dados, o quão satisfatória é uma explicação que ela fornece 
para uma gama de observações empíricas, o quão longo é o alcance de 
suas generalizações, o quão eficazmente ela acomoda novos dados. Uma 
enormidade de dados está disponível para qualquer falante nativo. No 
entanto, os fatos mais profundos acerca da estrutura linguística perma- 
necem escondidos dele. 


O que Chomsky chama de dados e fatos é o que Bogen & Woodward cha- 
mam de fatos sobre os dados e fatos sobre os fenômenos. Os dados seriam os 


32. Aos que teimam em ver “misticismo” nas abstrações chomskyanas, recomendo Abdalla 
(2004): uma introdução à fisica de partículas, à estrutura interna do átomo e suas múltiplas 
subpartes elementares, cuja existência não é diretamente observável, mas é inferida a partir 
de idealizações, e corroborada por seus efeitos, estes sim observáveis: evidência indireta 
para corroborar ou refutar afirmações feitas no plano das ideias. 

33, Para uma crítica às abstrações específicas envolvidas na concepção chomskyana de 
competência muito mais bem-informada e elaborada do que os ataques infundados 
de Bagno, recomendo Matthews (1979). 
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“observáveis! do desempenho (gravações, escritos, juízos de aceitabilidade, 
etc.). Os fatos seriam (os produtos d)as engrenagens gramaticais (codifica- 
das na mente do falante), que, quando postas em uso, determinam parcial- 
mente e indiretamente a forma dos dados. A competência é essa gramática 
não observável que se investiga. Como Chomsky admite nas passagens re- 
produzidas acima (cf. Chomsky (1965: cap 1; 1986a: cap 1,2) para discus- 
sões mais completas e elaboradas do tema), os dados do desempenho não 
refletem transparentemente a competência pura; refletem efeitos de muitos 
outros fatores, os quais a GGT põe de lado. Isso faz muitos declararem que 
os objetivos e os métodos da GGT são inviáveis, ainda que se aceite o recor- 
te chomskyano da competência como objeto de estudo. Tais objeções — que 
remontam a Weinreich et al. (1968: cap 1) e Labov (1972: cap 8) — estão bem 
manifestas em Lucchesi (2004: 215). 


O principal problema metodológico do gerativismo está na aferição de 
suas hipóteses de análise, através dos juízos de gramaticalidade (sic). 
Desenvolve-se nos espaços do fazer linguístico ainda não hegemoniza- 
dos por esse modelo uma resistência muito grande à possibilidade de se 
operacionalizar esses juízos de gramaticalidade na pesquisa, devido ao 
seu alto grau de subjetividade. [...] O problema é que esses juízos de gra- 
maticalidade são extremamente variáveis entre os falantes de uma mes- 
ma lingua, ou em um mesmo falante. A questão metodológica que se 
põe então é: como filtrar essa variabilidade para se chegar ao domínio da 
invariância da gramática universal, isto é, da dimensão estrutural e estru- 
turante do fenômeno linguístico? Nesse ponto, o problema metodológico 
se transforma em um problema teórico: como integrar a variabilidade 
inerente à manifestação concreta do fenômeno linguístico na concepção de 
objeto de estudo que o gerativismo propõe à linguística? 


Para Lucchesi, a impossibilidade de um método que filtre a “sujeira' nos 
observáveis para se chegar à competência pura acaba acarretando um in- 
transponível problema teórico que, em larga medida, deslegitima a concep- 
ção de língua e de linguística da GGT”. Parte da resposta a essa crítica já foi 
apresentada nas discussões acima. Continuemos. 


34, Lucchesi (2011: 239-241) afirma que o problema crucial da GGT não é de método, é de 
definição do objeto. 
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Como em qualquer ciência, essa filtragem não se dá apenas na cole- 
ta dos observáveis. Conclusões sobre engrenagens gramaticais dependem 
de conjecturas teórico-analíticas segundo as quais o cientista interpreta os 
dados e avalia a eficácia de análises concorrentes, elegendo aquela que me- 
lhor organiza o fenómeno. Isso implica não apenas prever a distribuição dos 
dados, mas fazer previsões testáveis acerca do que ainda não se observou, 
e em termos da obtenção, no plano teórico, de um modelo o mais enxuto 
e internamente coerente possível, no qual o maior número possível de fe- 
nômenos é tratado de modo unificado e generalizante pelo menor número 
possível de postulados. 

Toda explicação é abstrata e extrapolativa. O resto é catalogação de 
observações. 

Mas há um clamor legítimo no incômodo de Lucchesi diante da subje- 
tividade dos juízos de aceitabilidade, à mercê de muitos fatores que fogem 
completamente ao controle do procedimento rudimentar de apresentar 
um dado ao informante e solicitar um julgamento. Isso pode tornar o con- 
junto de julgamentos heterogêneo demais, ficando virtualmente impossí- 
vel detectar padrões de modo confiável. Chomsky (1964: 56) já antecipava: 


[ ulgamentos de introspecção não são sacrossantos e acima de qualquer sus- 
peita. Ao contrário, sua acurácia pode ser desafiada e corroborada de muitas 
maneiras, algumas bem indiretas. Consistência entre falantes de perfis simila- 
res, assim como num mesmo falante em ocasiões diferentes, constitui infor- 
mação relevante. 


Contudo, Lucchesi (op. cit.: 216) explicitamente parte da premissa falsa 
de que a obtenção de julgamentos de aceitabilidade seria necessariamente 
feita nos termos banais que esbocei acima. Quando alguém é abordado à 
queima-roupa com a pergunta “Ei, Alice, essa frase é boa pra você? E essa 
outra?”, não se sabe quais são os critérios para a pessoa dizer 'sim' ou 'não”. 
O bom é o que faz sentido? É o que veicula uma verdade? É o que fala 
sobre algo bom? É o que 'transmite uma mensagem no final das contas"? 
É o que soa curto e grosso, direto ao ponto e sem floreios? De fato, a co- 
leta de julgamentos de aceitabilidade pode ser feita de modo desastroso. 
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Lamentavelmente, muitas vezes o é. Mas a má prática dos maus linguistas 
não deve ser tomada como um problema inerente à GGT (cf. Chomsky 
196la: 228). 

Os problemas que oponentes levantam têm sido discutidos no âmbito 
da própria GGT. Chomsky jamais se dedicou a aperfeiçoar as técnicas de 
coleta de julgamentos de aceitabilidade; mas muitos adeptos e praticantes 
da GGT tém promovido desenvolvimentos significativos nesse sentido des- 
de a década de 1960, construindo assim a Psicolinguística Experimental”. 
Num debate ocorrido em 1958, Chomsky (1962b: 177-178) já se mostrava 
favorável ao desenvolvimento de métodos mais rigorosos e confiáveis de 
coleta de dados: 


No começo, nos valemos de intuições por falta de algo melhor, e a seguir busca- 
mos um refinamento via testagens. Tanto quanto qualquer um, cu não gosto de 
me basear em intuições. [...] Se chegarmos a um ponto em que tenhamos refina- 
do nossa base via investigação teórica e testes operacionais, ficarei satisfeito em 
parar de propor que devamos começar pela intuição do falante nativo. 


Pouco tempo depois, ele ponderou os prós e os contras de se concen- 
trarem esforços em questões metodológicas em detrimento das questões 
teórico-analíticas que ele via como prioritárias naquele estágio inicial da 
pesquisa. No texto clássico de Chomsky (1965: cap 1), em que se faz um ba- 
lanço da primeira década da GGT e se explicitam as diretrizes do programa 
de pesquisa futuro, ele se mostrava cético quanto às sugestões vagas feitas à 
época acerca de novos métodos objetivos, e defendia que, naquele momen- 
to, o aperfeiçoamento da metodologia de obtenção de juízos de aceitabili- 
dade mais finos e precisos, embora bem-vindo, era menos urgente que o 
aprimoramento do aparato teórico-analítico da GGT para uma vasta mas- 
sa de dados até então não satisfatoriamente explicados, e cuja robustez de 
julgamentos era incontestável”. Ainda que timidamente, Chomsky (1965: 


35, Cf. Fodor et al. (1974) para um panorama representativo dos resultados acumulados 
nos primeiros anos. 


36. Chomsky (1962a: 533) já havia levantado esse ponto, que viria a ser retomado em 
Chomsky (1968: 168), e aprofundado em Chomsky (1980a: cap 6). 
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21) reconhece o óbvio: “Possivelmente chegará o dia em que informações 
do tipo que hoje podemos obter abundantemente não sejam suficientes 
para resolver questões mais profundas da estrutura da linguagem”. Logo, ri- 
gorosamente falando, ele não se opôs categoricamente ao desenvolvimento 
e uso de técnicas mais apuradas de coleta de dados. No entanto, na mesma 
obra, Chomsky (1965: 19) criticava nada timidamente a ênfase dada por 
seus críticos a esse ponto, e o desprezo de muitos pelo que se pode obter 
via intuições: 


Existem muito poucos processos experimentais ou de tratamento de dados dig- 
nos de crédito para obter informações significativas acerca da intuição linguis- 
tica do falante nativo. É importante ter em mente que, quando se propõe um 
procedimento operacional, a sua adequação deve ser posta à prova [...] compa- 
rando-o ao padrão fornecido pelo conhecimento tácito que pretende especificar 
e descrever. 


Faz-se pertinente aqui uma analogia. Não há outra forma de se estudar 
o fenômeno da dor (seus correlatos neurofisiológicos, psicológicos e mo- 
tores) senão perguntando ao indivíduo se ele sente dor ou não (e quan- 
to) diante de estímulos de diferentes tipos e magnitudes. Pode-se também 
observar manifestações físicas tipicamente associadas à dor (expressões 
faciais, gritos, etc., ou mesmo dados observáveis através de metodologias 
mais sofisticadas como raio-X, ressonância magnética, imagens via técnicas 
de eletrofisiologia, etc.), mas isso de nada vale se não houver um método de 
averiguação de que tais eventos observáveis são mesmo manifestações de 
dor, e, para tal, é inevitável se passar por um estágio em que se pergunte à 
pessoa se ela sente dor (e quanto) enquanto grita, por exemplo, ou enquan- 
to o aparelho de laboratório exibe um dado padrão em seus medidores. Só 
assim é que se sabe que tais eventos físicos são manifestações de dor e não 
de outra coisa. 

Phillips & Lasnik (2003), em resposta a críticas de Edelman & Chris- 
tiansen (2003) semelhantes às de Lucchesi (2004), enfatizam que mesmo a 
mais simples coleta de juízos de aceitabilidade com papel e caneta é, sim, 
um experimento científico, e tem boa validade e confiabilidade para o que 
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se propõe se conduzida adequadamente. Isso envolve técnicas bem mais 
simples do que aquelas dos experimentos de laboratório, mas nem por isso 
menos importantes. Abaixo, relaciono informalmente alguns dos pontos 
nos quais se deve prestar atenção ao projetar e executar um experimento 
desse tipo. 

Exceto numa primeira triagem na fase de brainstorm, o linguista deve 
evitar usar as suas próprias intuições (ou as de seus colegas que conhecem 
bem o seu trabalho), contaminadas com o que a análise dele prevê que 
aconteceria”. Há que se evitar apresentar ao informante dados isolados. In- 
seri-los num contexto discursivo-pragmático controlado ajuda a eliminar 
vieses pragmáticos que forcem sua aceitação ou rejeição. Deve-se solicitar 
do informante uma resposta binária (sim/não) ou deve lhe ser dada uma 
opção neutra? Nesse caso, pedimos ao informante para julgar o dado numa 
escala de três valores? De cinco? Dez? Qualquer dessas possibilidades par- 
cialmente induz a certas respostas. É preciso conhecer as consequências de 
cada escolha, que não são mutuamente excludentes. É importante que o in- 
formante não perceba o que está sendo pesquisado (seu emprego da mor- 
fologia de concordância, ou ordem de adjuntos adnominais, etc.), ainda 
que ele saiba que sua linguagem está sob investigação. Caso contrário, ele 
pode acionar seu conhecimento metalinguístico (possivelmente incluindo 


37. Chomsky (1965: 20) disse que o linguista pode frequentemente observar suas próprias 
intuições. A meu ver, tal afirmação, embora não errada em si mesma, foi posta de um modo 
um tanto leviano, dando margem a que adeptos ou oponentes da GGT interpretem que o 
procedimento default é o linguista usar seus próprios juízos de aceitabilidade, o que, no 
limite o conduziria a um raciocínio tautológico (cf. Lucchesi 201 1:238-241). Tal foi o enten- 
dimento de Bagno (2012: 50), que afirma que, “[pjara Chomsky, todo falante [...] é perfeito 
conhecedor de sua gramática, de modo que o linguista não precisa sair a campo coletando 
dados do uso: ele pode se servir de sua própria intuição linguística para deduzir as regras 
que põem sua língua em funcionamento”. Essa não é a praxe na GGT, muito contraria- 
mente à caricatura que Bagno faz dela. O que ocorre é que, nos momentos de insight, de 
eureka, o linguista percebe padrões observando a sua própria fala, e se questiona se outras 
estruturas caberiam naquela mesma situação. Sua resposta para si mesmo é, potencial- 
mente, a descoberta de um fato. Mas isso precisa subsequentemente passar pelo crivo do 
julgamento de outros informantes, não comprometidos com a análise sendo desenvolvida 
(cf. Chomsky 1964: 56). Ao fim, cabe a um linguista estudar o idioleto do outro. 
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um viés normativista), afetando a naturalidade das respostas. Se possível, é 
melhor que ele nem saiba que é a sua linguagem que está sob investigação. 

Há meios de se disfarçar os testes de aceitabilidade, maneiras indiretas 
de se obter os juízos, submetendo o informante a uma tarefa que lhe pare- 
cerá não linguística (teste de compreensão da história que lhe foi narrada, 
elicitação de enunciados como resposta a situações comunicativas, etc.), 
mas que em realidade testa indiretamente sua competência gramatical, de 
um modo em que se podem controlar alguns fatores externos relevantes”, 
A ordem com que se apresentam os dados ao informante também pode in- 
terferir no resultado (e.g. aquilo que se julga ruim no início da sessão pode 
ser julgado bom ao final da sessão, após uma fase de familiarização). Há 
técnicas para se contornar esse problema, chamado efeito de saciação (cf. 
Snyder 2000). Outra prática que eleva o grau de confiabilidade dos testes 
é a inclusão, em meio aos dados a serem julgados, de exemplos não rela- 
cionados com o que está sob investigação, e cuja única função é distrair o 
informante para que ele não perceba do que trata o teste. Tipicamente, o 
número de dados distratores excede o número de dados alvo, e eles apare- 
cem estrategicamente intercalados ('embaralhados”). 

Na condição de haver um enviesamento provocado pelos protocolos 
experimentais, ele deve sempre se direcionar para o lado de aumentar a 
probabilidade de o informante dar respostas favoráveis à hipótese nula, i.e. 
aquela contrária à hipótese experimental sendo proposta e testada. Se, ainda 
assim, o informante der respostas que corroboram a hipótese do linguis- 
ta, pode-se, com mais confiabilidade, afirmar que tal hipótese foi de fato 
corroborada”. Aliás, esse tipo de enviesamento (e só esse) é não apenas 


38. Tais técnicas envolvem protocolos experimentais mais elaborados (cf $5.5), e são mui- 
to usadas para estudar a linguagem de crianças, as quais não têm a mesma habilidade me- 
talinguística dos adultos para responder se um dado é bem-formado. E elas podem ser 
aplicadas com informantes adultos também. Para uma introdução a tais técnicas, cf. Crain & 
Thornton (1998), Crain & Lillo-Martin (1999) e Grolla & Figueiredo-Silva (2014). 

39. Como numa partida de xadrez em que o jogador X inicia excepcionalmente com ape- 
nas metade das peças, e o jogador Y, com todas. Se, ainda assim, X vencer, temos em X um 
campeão incontestável. 
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aceitável como desejável. Isso é um padrão praticado em experimentos nas 
mais diversas áreas científicas. 

Como também apontam Phillips & Lasnik (2003), há décadas já são 
conduzidos, no âmbito da GGT, experimentos mais sofisticados, que cap- 
turam a (inaceitabilidade com uma granularidade mais fina, e que en- 
volvem um aparato tecnológico específico, incluindo: (i) rastreamento de 
movimento ocular, (ii) eletroencefalografia, (iii) medição de tempo de rea- 
ção, etc. Para uma breve introdução ao tema, recomendo Maia (2015). Para 
detalhes, recomendo começar por Cowart (1997). Além disso, recomendo 
as obras dos seguintes autores-chave na área: Janet Fodor, Edward Gibson, 
Colin Phillips e Jon Sprouse. 

Phillips (2009), um experimentalista hardcore, defende veementemente 
que, embora os métodos experimentais de última geração sejam absolu- 
tamente necessários para detectarmos detalhes finos dos fenômenos, so- 
zinhos eles são inúteis. Eles devem ser complementados por experimen- 
tos mais “rudimentares” feitos com o velho método de lápis e papel e uma 
solicitação para o falante emitir um julgamento de aceitabilidade acerca 
de uma sequência de ILs (desde que executados com os cuidados mencio- 
nados acima). Mais que isso, antes de vir conectar fios elétricos ao couro 
cabeludo das cobaias, é preciso, como pré-requisito, ter uma teoria que faça 
previsões acerca do que se pode ou não encontrar nos medidores dos apa- 
relhos. Sem a teoria (construída com lápis, papel, transpiração, inspiração 
e intuição), não se chega a lugar algum, pois a tela do computador só vai 
mostrar manchas cujo significado desconhecemos”. Aproximadamente 
nessa direção, Sprouse & Almeida (2012) defendem a validade dos testes 
mais rudimentares (bem-feitos) através de uma comparação direta entre 
duas investigações paralelas da mesma base empírica, composta de 469 da- 
dos oriundos de um manual didático (Adger 2003), que inclui uma série 
de estruturas bem-intrincadas. Uma das investigações nada mais era que 


40. Cf. Gibson & Fedorenko (2013) para uma crítica a Phillips (2009). 


os resultados reportados por Adger, obtidos via testagens “rudimentares. A 
outra investigação foi conduzida pelos autores em laboratório, por meio 
dos mais avançados métodos e dispositivos tecnológicos, com 440 infor- 
mantes. Surpreendentemente ou não, 98% da descrição de Adger (2003) 
converge com a de Sprouse & Almeida (2012). Essa margem de erro de 2% 
não é tão pequena quanto parece (afinal, quem não gostaria de ter imensos 
2% de chance de ganhar na loteria comprando um só bilhete?), mas indica 
fortemente que, se bem planejados e executados, os testes mais 'rudimenta- 
res fornecem dados bastante confiáveis". Resultados e conclusões seme- 
lhantes encontram-se também em Sprouse & Almeida (2013a) e Sprouse 
etal. (2013). 

Faz-se pertinente aqui uma observação sobre eventuais discrepâncias 
acerca de juízos de (in Jaceitabilidade (cf. Newmeyer 1983: 53-55). É comum 
um pesquisador apresentar dados rotulando-os quanto à (in Jaceitabilidade 
e (a)gramaticalidade e ser duramente contestado por alguém, que diz: “Essa 
frase « que você diz ser ruim é ótima pra mim” (ou o contrário). Qualquer 
afirmação sobre a realidade empírica pode ser contestada; mas, infelizmen- 
te, muitas vezes isso é feito de modo improdutivo, Quando ocorrem dis- 
crepâncias de julgamento, muitas são as possibilidades. Uma delas é que o 
pesquisador de fato coletou seus dados com um método falho, o que torna 
a crítica pertinente. Mas, nesse caso, o foco da crítica deve ser um questio- 
namento dos métodos, e não uma simples afirmação categórica de que o 
pesquisador reporta os fatos incorretamente. Se o autor da pesquisa não 
tem autoridade para arbitrar o que é (inaceitável, o mesmo vale para o crí- 
tico. A crítica construtiva deve buscar o refinamento dos métodos, adiando 
as conclusões, em vez de concluir em contrário prematuramente. Outra 
possibilidade é que o pesquisador esteja, de fato, reportando corretamente 
a realidade que ele observou. Nesse caso, provavelmente estamos diante de 


41. CF. Gibson et al. (2013) e Sprouse & Almeida (2013b) para um debate entre posições 
opostas quanto ao tema. 
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diferenças dialetais/idioletais entre o autor e seu crítico (lembrando que o 
dado reportado não necessariamente coincide com o dialeto falado pelo 
autor). Nesse caso, é inócuo buscar quem tem razão numa pseudodisputa 
'meu dialeto versus seu dialeto” É igualmente inócuo simplesmente aceitar- 
mos tal diferença sem discuti-la, achando que, por serem gramáticas dife- 
rentes, elas não podem nem devem ser comparadas. É exatamente nesses 
casos que temos a oportunidade de testar as previsões das nossas análises. 
Diante de uma discrepância significativa em torno do dado «, devemos nos 
perguntar que previsão a análise do pesquisador faz para um outro dado f, 
ainda não observado, com estrutura similar, porém diferindo num detalhe 
específico. Se a análise que prevê que «a é “ruim” também prevê que seja 
“bom; por exemplo, e se for atestado que os mesmos informantes que antes 
julgaram « agora julgam 8 como “ruim” pelos mesmos métodos, então há 
um problema sério na análise em foco”. Caso contrário, o questionamento 
levantado apenas corrobora a visão do pesquisador. Para uma discussão 
mais profunda e elaborada sobre esse tema, recomendo fortemente a leitu- 
ra de den Dikken et al. (2007). 


52.5. A INEXORABILIDADE DOS JUÍZOS DE ACEITABILIDADE: 
DADO POSITIVO E DADO NEGATIVO 


Retomemos os pares em (6) e (7) acima, renumerados como (16) e 
(17): 


42. Felizmente, há críticas mais lúcidas e construtivas aos métodos chomskyanos de coleta 
e classificação de dados (e.g. Labov 1972: 192-199; Levelt 1974: cap 2; Moore & Carling 1982: 
70-82, 1985: 17-20). 

43. Em (16-17), o símbolo “O” indica uma “lacuna” na posição de objeto da sentença su- 
bordinada, interpretada como “aquele sendo espionado: O simbolo x subscrito na lacuna 
e no elemento (des)locado na margem inicial indica que ambos os elementos sintáticos 
são interpretados como se referindo à mesma entidade. Na GGT, (16-17) são analisados 
em termos do movimento de quem da posição da lacuna para a margem inicial. Por ora, o 
essencial aqui é a dependência de longa distância entre posições distintas, quer isso envolva 
movimento ou não. 
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(164) Léo alertou você [que Zé espionava Cris]. 

(16b) Quem, (que) Léo alertou você [que Zé espionava O )? 

(17a) Léo alertou você [enquanto Zé espionava Cris). 

(17b) * Quem, (que) Léo alertou você [enquanto Zé espionava O]? 


O três primeiros exemplos são dados positivos (i.e. exemplos de um 
arranjo gramaticalmente possível de ILs) e o último é um dado negativo 
(i.e. exemplo de um arranjo gramaticalmente impossível de ILs, juntamen- 
te com a informação explícita dessa impossibilidade)“. Dados positivos 
abundam nos discursos observáveis, mas dados negativos não. Contudo, 
há dados positivos muito raros, não facilmente encontrados em qualquer 
corpus. Como saber se um arranjo específico de ILs é um dado positivo da 
língua? À intuição do falante nativo nos dirá, via juízo de (in Jaceitabilida- 
de. Os dados negativos, porém, estariam, por definição, ausentes de qual- 
quer corpus típico (retomo esse ponto adiante). 

O linguista sabe que os três primeiros dados são aceitáveis/gramaticais 
porque os falantes os julgam aceitáveis à primeira vista. Não é implausível 
que isso se desse por analogia a outras sentenças já conhecidas, que tenham 
o mesmo “esqueleto estrutural, preenchido por outros ILs. Não há dúvida 
de que algo como analogia faça parte da inteligência geral humana, aplicá- 
vel também em várias tarefas cognitivas além da linguagem. Mas analogia 
envolve a inclusão de novos casos em um paradigma, com base em seme- 
lhança. E quais são os critérios para se medir a semelhança? Mesmo nos 
restringindo aos três primeiros exemplos, não é trivial o fato de os aceitar- 
mos 'por analogia” a outras estruturas semelhantes da língua, a menos que 
especificados os critérios nos quais essa analogia se baseia, com a devida 
justificativa. Boa parte da teoria gramatical se ocupa disso através da for- 
mulação e testagem de hipóteses sobre as regras gramaticais, seu alcance e 
seus limites na aplicação a novos casos. Como testar a hipótese de que os três 


44.0 dado agramatical por si só não constitui o dado negativo; é necessária a informação 
correspondente a '*. 


primeiros dados são previstos pelo sistema da “língua'? Uma possibilidade 
é criar esses dados e submetê-los a testes de aceitabilidade, mais rudimen- 
tares ou mais sofisticados. Outra seria vasculhar uma quantidade gigante 
de enunciados efetivamente produzidos e averiguar se achamos ocorrências 
desses exemplos. Se não acharmos, isso não significa que eles não são pre- 
vistos pelo sistema da “língua Significa apenas que não os encontramos no 
corpus inspecionado. 

Quanto a (17b), como o linguista sabe que ele é inaceitável, estranho, e 
possivelmente agramatical? Nesse caso, não adianta inspecionar um corpus 
colossal de bilhões de sentenças, coletado a partir da fala e da escrita de 
muitos falantes. Se (17b) não consta nos registros, isso provavelmente se 
deve ao fato de ele não ser uma sentença da “língua” Mas, atenção: o fato é 
que (17b) não consta nos registros por não ser dado da “língua”; e não que 
ele não é um dado da língua por não constar nos registros. Afinal, os três 
exemplos anteriores também não constavam nos registros do leitor até a 
leitura deste livro. E também não constavam nos meus registros até eu os 
criar, o que fiz usando a minha gramática. Cabe aqui citar a máxima filo- 
sófica “ausência de evidência não é evidência de ausência”. Ou seja, sem 
consultarmos a intuição do falante nativo, temos ausência de evidências 
diretas de que (17b) seja aceitável/gramatical. Mas isso não é evidência de 
que (17b) esteja ausente do conjunto de sentenças aceitáveis/gramaticais. A 
rigor, também temos ausência de evidências diretas de que (17b) seja ina- 
ceitável/agramatical, até consultarmos a intuição do falante nativo. 

A conclusão inescapável é que juízos de aceitabilidade, sejam eles frágeis 
ou robustos, coletados de modo mais confiável ou menos, são absoluta- 
mente imprescindíveis para construirmos uma teoria gramatical, Sem isso, 
é impossível obter dados negativos (nem mesmo todos os dados positivos 
de que precisamos). Dados negativos são cruciais por serem as únicas evi- 
dências empíricas acerca do que é impossível gramaticalmente. Aprecie- 
mos de perto esse caráter imprescindível dos dados negativos comparando 
os dados acima. Diante da possibilidade de (16a) e de (16b), poderíamos 
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concluir 'por analogia” que (17b) seria possível, posto que (17a), um dado 
positivo, é análogo a (16a), enquanto (17b) é análogo a (16b). A questão é 
ainda mais complexa. Observe os dados positivos em (18) e (19), 


(18a) Quem, (que) Léo alertou O, [que Zé espionava Cris)? 
(18b) Quem, (que) Léo alertou O, [que Zé espionava O)? 
(19a) Quem, (que) Léo alertou O, [enquanto Zé espionava Cris]? 


(19b) Quem, (que) Léo alertou O, [enquanto Zé espionava O)? 


(18a) e (19a) ilustram o fato trivial de o objeto do verbo principal também 
poder ser uma lacuna indexada a um pronome interrogativo fronteado. 
(18b) e (19b) também tém essa característica, e, além disso, trazem uma 
lacuna como objeto do verbo da oração subordinada. Assim como (18a) 
e (19a) são análogas, o mesmo vale para (18b) e (19b), em que há duas 
lacunas (uma em cada posição de objeto) e um pronome interrogativo 
deslocado, com coindexação entre os três. É importante frisar que (19b) 
também é análogo ao dado negativo (17b), pois ambos trazem, dentro da 
oração subordinada adjunto do verbo, uma lacuna indexada a um pro- 
nome interrogativo fronteado. Por que, então, (19b) não seria inaceitável/ 
agramatical por analogia a (17b)? Não há nada de ilógico nessas analogias. 


45. A aceitabilidade de (18a) e (19a) é consensual, assim como a de (19b), o dado crucial 
para esta discussão. Há alguma controvérsia em torno de (18b). Em “línguas! como “inglês, 
dados com esse mesmo formato geral são aceitáveis ou não, a depender de seus detalhes fi- 
nos (cf. Chomsky 1986b: 61-62), o que se relaciona a um ponto técnico que vai além do nosso 
escopo aqui (i.e. o fato de a lacuna legítima c-comandar a lacuna parasita, cf. Chomsky 
(1982a: 40-42; 1986b; 54-55) e obras lá citadas). Apesar de muitos brasileiros aceitarem (18b) 
com a interpretação relevante, não se pode descartar a possibilidade de a gramaticalidade 
de (18b) ser questionável, e sua relativa aceitabilidade ser um efeito colateral do fato de que, 
diferentemente do “inglés, o “portugués brasileiro” tem mais meios de licenciamento de 
“objetos silenciosos nas mais variadas configurações, independentemente de pronomes in- 
terrogativos fronteados. Para fins práticos, tomo (18b) como gramatical. Se o considerarmos 
agramatical, a discussão certamente ficaria mais complexa, mas não no sentido de refutar a 
tese principal a favor do inatismo da restrição de ilha e dos mecanismos de licenciamento de 
lacunas parasitas. Ao contrário, tal complexidade só reforçaria a tese de que a aquisição se dá 
a partir de uma amostra de dados incompleta e enganadora (cf. $5). 
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(17b) é estranho, apesar de suas inegáveis semelhanças estruturais com da- 
dos positivos. 

Essa estranheza tem a ver com o tipo de oração subordinada contendo 
a lacuna na posição de objeto. Se a subordinada é complemento de alertou, 
todas as possibilidades de distribuição e indexação de lacunas se verificam. 
Se a subordinada não é complemento de alertou, a lacuna dentro dela pode 
estar indexada a uma outra lacuna na posição de objeto da sentença prin- 
cipal (que por sua vez estaria indexada ao pronome interrogativo frontea- 
do); mas não pode estar indexada diretamente ao pronome interrogativo 
fronteado, sem que tal coindexação seja “intermediada” pela lacuna legíti- 
ma no objeto de alertou. O que acabo de fazer é só uma descrição inicial, 
não uma explicação, a qual demandaria a explicitação de hipóteses testá- 
veis acerca das regras gramaticais que estabelecem essas relações, gerando 
como resultado o padrão descrito acima. Entretanto, quaisquer que sejam 
os processos gramaticais envolvidos, primeiramente é preciso o linguista 
descrever adequadamente o que a gramática permite ou proíbe. Para tanto, 
ele precisa saber que (17b) é anômalo. 

Como saber? Analogias são úteis no processo de construção de hipó- 
teses, como acabamos de ver, mas também podem nos levar a armadi- 
lhas perigosas. Nos dados sob comparação, que aspectos seriam ou não 
relevantes para eles serem tomados como análogos? O único modo de se 
constatar empiricamente uma impossibilidade gramatical é construindo 
dados e obtendo juízos negativos de aceitabilidade por parte dos falantes 
(e posteriormente inferindo sua agramaticalidade com auxílio de racioci- 
nios analíticos auxiliares (cf. $2.1, $2.2, $2.4)). Sem isso, jamais teremos 
certeza da impossibilidade de certos arranjos de ILs, apenas a certeza de 
que não os encontramos em nenhum corpus inspecionado até hoje, o que 
não nos diz nada de significativo, assim como o fato de Ideias verdes inco- 
lores dormem furiosamente estar ausente de todos os corpora anteriores a 
1955 não significava nada sobre a (in)aceitabilidade e (a)gramaticalidade 
de tal exemplo. Em debate com estruturalistas na Third Texas conference 
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on problems of linguistic analysis in English em 1958 (cujos anais datam de 
1962), Chomsky (p. 28, 76, 78, 159) salienta que nem mesmo corpora gigan- 
tescos, virtualmente exaustivos, trazem dados negativos. São uma amostra 
grande, mas não apontam uma gramática que faça previsões sobre o pos- 
sível e o impossível. Chomsky (1980a: 198-199) acrescenta que um corpus 
pode conter “falsos dados positivos” resultantes de desvios de desempenho 
acidentais, numa quantidade maior ou menor a depender da natureza do 
corpus. Se esse “ruído” não for devidamente “filtrado”, corre-se o risco de 
classificar erroneamente dados agramaticais como sendo gramaticais. Tal 
filtragem passa em larga medida pela coleta, em paralelo, de juízos de acei- 
tabilidade e de elicitação de enunciados. 

Além disso, mesmo nos cânones da chamada linguística de corpus (cf. 
Labov 1972: 188, 203), admite-se que os corpora de fala e escrita também 
exibem um tanto de “sujeira” junto com os muitos dados positivos. Ou seja, 
há, em meio a sentenças genuínas, sequências de ILs que são decorrentes 
de “atrapalhações, pelos mais diversos fatores (o que só reforça a dicoto- 
mia competência/desempenho, que, ao contrário do que muitos pensam, 
não é rejeitada in totum na perspectiva laboviana). Eventualmente, po- 
demos encontrar num corpus algo como “A televisor quebrou, que traz 
uma clara violação de concordância de gênero entre o nome-sujeito e seu 
artigo, possivelmente porque o falante pensou em falar televisão em vez 
de televisor e, na “hora H', se atrapalhou ou mudou de ideia. Note que 
isso não é um dado negativo, a menos que venha acompanhado de uma 
indicação explícita de sua rejeição, o que é raríssimo“. Ou seja, há uma 
margem de erro de 'sujeira' a ser descartada. Os critérios para esse descarte 
não são triviais, mas, se não fizermos isso, teríamos de atribuir o mesmo 


estatuto gramatical a “O televisor quebrou e “A televisor quebrou, o que 


46. Não é raro alguém dizer “Desculpa, eu errei, o que eu queria dizer era [...)”, Esse tipo de 
correção, entretanto, não é suficiente para inferir que o erro estava na estrutura gramatical, 
e em qual parte da estrutura estaria o erro. Sem uma indicação explícita, pode-se pensar 
que se trata de uma “inadequação discursiva” de qualquer natureza, uma substituição de 
uma mensagem por outra. 
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implicaria a negação categórica de qualquer versão da noção de (a)grama- 
ticalidade (cf. Sampson 2007), sem a qual não há teoria gramatical viável 
(cf. Pullum 2007). 

Independentemente da insatisfação dos antichomskyanos mais fervo- 
rosos diante dos juízos de aceitabilidade, não há outro meio de se obter os 
dados negativos”, sem os quais não se pode hipotetizar nem testar regra 
gramatical alguma, a menos que, numa terça-feira, um anjo caído mira- 
culosamente nos sussurre ao ouvido a revelação divina da negatividade de 
um dado. É surpreendente como algo tão cristalino não seja devidamente 
reconhecido pelos críticos, que insistem na falácia da suficiência dos da- 
dos positivos. Faz-se pertinente aqui citar duas passagens da obra clássi- 
ca de Labov (1972), muito mais para criticar os 'maus labovianos” do que 
o próprio Labov, que ao menos modalizou seu discurso. Confrontando 
Chomsky diretamente, Labov (1972: 202) afirmou: 


Em sintaxe, nossas primeiras análises de uma dada forma são relativamente 
superficiais; mas, quando são notadas diversas relações com outras estruturas 
sentenciais, começa a surgir uma gama rica de estruturas subjacentes com- 
patíveis. Há um segundo paradoxo cumulativo envolvido aqui: quanto mais 
se sabe sobre uma língua, mais se pode descobrir sobre ela. As limitações 
impostas por Chomsky aos dados do input o levaram à convicção de que a 
teoria é subdeterminada pelos dados [...], ou seja, sempre haverá muitas aná- 
lises possíveis para cada porção de dados, e serão precisos meios internos de 
avaliação para decidir entre elas. Assumimos a posição oposta. Por meio do 
estudo direto da língua em seu contexto social, a massa de dados disponível 
se expande enormemente e nos fornece formas e meios para decidir qual das 
várias análises possíveis é a correta. 


Fora de contexto, esta passagem sugere fortemente um desprezo total pelo 
método de coleta de juízos de aceitabilidade, sem os quais não obtemos da- 
dos negativos, que são cruciais. Infelizmente, é assim que muitos autopro- 
clamados labovianos conduzem suas pesquisas. De fato, na mesma obra, 
Labov (1972: 191-199) critica duramente o método chomskyano baseado 


47. Em $5.6, critico a ideia de que se pode obter evidência negativa indireta através da massa 
de dados positivos. 
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em instrospecção psicológica como base empírica primária. Porém, logo 
adiante, Labov (1972: 201-202), ainda que sem conferir destaque para a im- 
portância crucial dos dados negativos, reconhece que não se pode abrir 
mão completamente dos dados de intuição*: 


A crítica ora apresentada aos métodos linguísticos convencionais não deve ser 
tomada como sugestiva de que eles sejam abandonados. A elicitação formal de 
paradigmas, o exame de julgamentos intuitivos, o estudo de textos literários, a 
experimentação em laboratório, os questionários sobre o uso linguístico — todos 
eles são modos de investigação importantes e valiosos. Os dois primeiros proce- 
dimentos devem ser dominados por qualquer um que almeje conduzir análises 
linguísticas significativas. 


Há mais questões importantes sobre o papel dos dados negativos na 
teorização gramatical e da sua obtenção via juízos de aceitabilidade em 
oposição a uma obtenção indireta, observando-se a ausência sistemática de 
certas estruturas na massa de dados positivos. Retomo esse tema em $2.7, 
$5.3 e $5.6. Até aqui, falo da impossibilidade de o linguista ter certeza de 
que um dado tipo de arranjo de ILs é impossível a menos que ele colete juí- 
zos de aceitabilidade negativos para dados que ele mesmo constrói. Iustrei 
isso acima (cf. (16-19)) com um paradigma em que o dado-chave (17b) é 
negativo. Logo, não há informação suficiente in natura para que a gramá- 
tica seja inteiramente desvendada apenas a partir de dados de fala espontá- 
nea. É preciso complementá-los com dados construídos pelo linguista após 
suas conjecturas, e então submetidos ao julgamento dos falantes. Veremos 
adiante, em $5,5, que uma tarefa parecida é enfrentada pela criança no 
processo de aquisição da “língua” Para ela, isso é ainda mais difícil (a rigor, 
impossível), porque ela ainda não desenvolveu completamente todo o seu 
aparato de habilidades perceptuais e cognitivas que possam auxiliá-la na 
tarefa, e não tem como obter dos falantes ao seu redor juízos de aceitabili- 
dade negativos que lhe ajudem a confirmar ou refutar hipóteses. 


48. Infelizmente, esta importantíssima diretriz metodológica laboviana é frequentemente 
ignorada na prática da pesquisa sociolinguística, que acaba por fornecer descrições incom- 
pletas, sem dados negativos cruciais. 
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52.6. NÍVEIS DE ADEQUAÇÃO: OBSERVACIONAL, DESCRITIVO, 
EXPLICATIVO E SUPRAEXPLICATIVO 


Qualquer teoria (em qualquer área do conhecimento) é tanto mais ade- 
quada (bem-sucedida, correta, etc.) quanto mais ela atinge seus objetivos 
de promover a compreensão dos fatos que ela se propõe a investigar, sendo 
uns mais simples e outros mais complexos. Mais que isso, os muitos fatos 
que compõem o grande fenômeno sob o escopo de uma disciplina cienti- 
fica tipicamente se organizam em camadas de complexidade. Em relação à 
linguagem, a visão chomskyana pode ser sumarizada como em (20): 


(20) 


(i) adequação observacional 


(ii) adequação descritiva 


(iii) adequação explicativa 


(iv) adequação neurofisiológica 


— (Vadequaçãoevolutiva 


A figura (20) explicita o que chamo aqui de cinco níveis de ambição de teo- 
rias linguísticas. Uma teoria é tão mais ambiciosa quanto mais ela pretende 
compreender. A compreensão de certos fenômenos pressupõe a compreen- 
são de outros (i.e. pressupõe que a teoria já tem respostas adequadas para 
perguntas que são logicamente anteriores). É por isso que a figura traz essas 
subempreitadas científicas em caixas dentro de outras caixas. A tarefa de 
se tentar formular uma teoria adequada no nível (20v) pressupõe logica- 
mente que já se tenha uma teoria razoavelmente adequada no nível (20iv), 
o que pressupõe logicamente um relativo êxito no nível (20iii), o que pres- 
supõe logicamente ter atingido boa parte dos objetivos do nível (20ii), o 
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que pressupõe logicamente ter executado bem a tarefa do nível (20i). 
Chomsky formula esse raciocínio em termos de níveis de adequação da 
teoria linguística. 

Os níveis (20i) e (20ii) são mencionados já em Chomsky (1951: 1-3), re- 
feridos repectivamente como processos de descoberta e processos de descrição. 
Como culminação de uma reflexão desenvolvida desde Chomsky (1955a: 
cap II, 1957: cap 2, 1961a, 1962a), os termos adequação observacional e ade- 
quação descritiva são explicitamente definidos em Chomsky (1964: cap 2), 
que inclui ainda o nível de adequação explicativa (20iii) em sua definição de 
níveis de sucesso em descrição gramatical. Chomsky (1965, cap 2) sumariza 
essas relações entre os níveis (com enfoque em (20ii) e (20iii)) no contexto 
geral de outras discussões teórico-metodológicas. Os níveis (20iv) e (20v) — 
cujos nomes dados por mim acima não são terminologia oficial — só come- 
çaram a ganhar destaque na GGT há cerca de duas décadas (aglutinados sob 
o rótulo de adequação supraexplicativa (Chomsky 2004)), embora, a rigor, 
eles já estivessem postos desde as obras de Lenneberg (1960, 1964, 1967). 

No nível observacional, o linguista simplesmente (aliás, isso não é tão 
simples quanto possa parecer) cataloga os dados observados, tomados cada 
um como uma mera sequência de ILs (atrelada a uma dada curva melódica 
e um significado). Trata-se, enfim, da execução do primeiro passo, que é o 
reconhecimento do que é ou não é uma sentença da língua. Fora do âmbi- 
to da GGT, é comum chamar essa busca por adequação observacional de 
descrição linguística (frequentemente privilegiando os dados positivos em 
detrimento dos negativos). Tal nomenclatura paralela faz um certo sentido, 
pois a catalogação dos dados já envolve inevitavelmente um ato de descri- 
ção. Mas se trata fundamentalmente da descrição dos dados observados 
enquanto sequências de ILs, sem maiores preocupações com a natureza 
exata de suas estruturas internas (que, por ora, indico aqui muito simpli- 
ficadamente através de colchetes, índices subscritos e rótulos categoriais). 
Embora a referida catalogação possa ser feita sob a forma de uma gramá- 
tica, contendo regras declarativas acerca das combinações (im )possíveis, 
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um trabalho que atinge apenas adequação observacional não descreve as 
engrenagens internas da gramática responsáveis por atribuir a cada dado 
a estrutura interna que ele tem. Sem uma descrição adequada da gramá- 
tica, a previsão que a teoria faz quanto aos dados possíveis e impossíveis 
é mera catalogação, já que não tem como capturar relações importantes 
entre sentenças, reconhecidas facilmente pela intuição do falante nativo, 
Iustro esse ponto começando por (21). Há duas interpretações possíveis, 
parafraseadas em (22). 


(21) Aline vendeu o carro rápido. 


(22a) O carro rápido, Aline vendeu. (22b) O carro, Aline vendeu rápido. 


Uma teoria que simplesmente declara que uma sentença pode ter o forma- 
to nome'verbo'artigo"nome”adjetivo atinge adequação observacional ao 
prever que (21) é uma sentença possível. Entretanto, ela não captura devi- 
damente a ambiguidade referida, exceto pelo mero fato de reconhecer que 
ela existe. Uma teoria descritivamente adequada deve dar conta do fato de 
que cada um dos dados em (22) é não ambíguo. Em (22a), o carro é que é 
rápido; em (22b), rápido é o modo como a venda foi executada. Uma teo- 
ria que concebe sentenças como não apenas sequências de ILs, mas como 
arranjos de ILs em blocos que se combinam em blocos maiores, pode, a 
depender de como é formulada, prever a existência de duas estruturas dis- 
tintas para a mesma sequência em (21), tal como em (23). 


(23a) ["""º Aline] [""""“º vendeu ["""º o carro rápido] | 
(23b) [re Aline) [""""“* vendeu ["""" o carro] rápido) 


Assim, prevemos que o dado (22a) só tem a interpretação de 'carro rápi- 
do' porque seria derivado de (23a), pelo fronteamento da unidade [o carro 
rápido], na qual a qualidade de ser rápido incide apenas sobre carro, porque 
rápido está encapsulado num bloco que não contém vendeu. Analogamente, 
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o dado (22b) só tem a interpretação de vendeu rapidamente” porque seria 
derivado de (23b), pelo fronteamento da unidade [o carro), que, crucial- 
mente, não contém dentro de si rápido, o qual, estando fora daquele bloco, 
pode assim incidir sobre vendeu orearro, por haver mais proximidade estru- 
tural entre o verbo e o adjetivo. Uma teoria formulada nesses termos (com 
organizações em blocos, mecanismos de deslocamento de partes, ou qual- 
quer dispositivo equivalente que seja igualmente poderoso) consegue ir além 
da adequação observacional e avançar significativamente rumo à adequação 
descritiva, pois descreve não só os dados, mas o sistema gramatical que gera 
os dados e as relações entre eles, constituindo-se num modelo abstrato da 
competência do falante nativo (cf. $3.2). 

Pode-se, por convenção terminológica, adotar a definição bloomfiel- 
diana de língua como uma coleção de todos e apenas os arranjos de ILs 
que constituem sentenças reconhecidas como gramaticalmente bem-for- 
madas pelos membros de uma comunidade de fala. Mas isso, por si só, 
não nos leva a compreensão alguma do fenômeno linguístico. Para tanto, 
é preciso investigar as propriedades do sistema gerador dos dados (que 
por ora podemos chamar de a gramática da língua), e consequentemente 
as propriedades estruturais das representações mentais dos dados, para 
além do mero sequenciamento de ILs. Assim, em vez de apenas catalogar 
uma mera coleção de sentenças, temos uma compreensão da natureza do 
sistema que determina por que cada sequência é ou não é válida enquan- 
to sentença. 

Tomemos agora um fragmento mais complexo da língua, retomando os 
dados de (16) a (19). Lembre-se que (17b) é um dado negativo, não obser- 
vável, exceto se for primeiramente construído a partir de reflexões teórico- 
-analíticas e subsequentemente submetido ao julgamento do falante, o que 
já envolve um trabalho no nível da adequação descritiva. Em todo caso, a 
catalogação daqueles dados, se for muito bem-feita, atinge apenas adequa- 
ção observacional. Embora não tenhamos, até o momento, explicitado um 
fragmento de gramática que efetivamente dé conta de todos os detalhes ali 
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envolvidos”, temos um bom rascunho de uma resposta geral a ser detalha- 
da, e que poderíamos sumarizar em (24). 


(24) Um pronome interrogativo fronteado deve estar vinculado a uma lacuna na 
posição em que é interpretado. 

(24b) Se uma lacuna estiver contida numa sentença subordinada que não seja com- 
plemento do verbo subordinante, ela não é vinculável a um pronome interro- 
gativo fronteado. 

(24c) Lacunas 'órfas' (descritas em (24b)) podem se vincular a uma outra lacuna 
legitimamente vinculada a um pronome interrogativo fronteado. 


(24) é uma descri 
porquê de a gramática ser assim e não de outro jeito. De qualquer modo, 
algo próximo disso faria parte da competência do falante adulto da “língua! 
eé por isso que o dado em (17b) é rejeitado, a despeito das já mencionadas 


jo não técnica do que há na gramática; não explica o 


semelhanças com os demais dados do paradigma. A próxima questão que 
se coloca é como esse falante adulto veio a internalizar algo como (24b) 
em sua competência. Se a criança não teve acesso a dados negativos como 
(17b), como ela teria sido capaz de não se deixar enganar pelas aparências 
a ponto de acabar incorporando (17b) à sua gramática por analogia aos 
dados que pôde observar? Enfim, por que a criança adota essa gramática 
com a proibição em (24b) e sua flexibilização em (24c), se uma gramática 
sem elas também seria compatível com a sua experiência? Uma teoria que 
explique isso atinge o nível da adequação explicativa (20iii). Tal teoria pres- 
supõe adequação nos dois níveis inferiores. Não se pode explicar como a 
criança internalizou a gramática G, (e não G,) sem termos primeiramente 
uma boa caracterização dessa gramática G, que a criança internalizou, o 


49, Muitas questões permanecem abertas (cf. n. 43). Seriam as lacunas “pronomes silen- 
ciosos' aos quais o elemento distante se vincula? Seriam elas o vazio deixado pelo deslo- 
camento do elemento que ali esteve (e.g. quem)? Poderia haver vinculação diretamente 
com o verbo da oração subordinada? Há toda uma literatura avançada sobre isso, cujas 
análises se baseiam nos conceitos de ilhas de extração e lacunas parasitas (cf. Taraldsen 
1981; Engdahl 1983; Chomsky 1982a: 36-78; 1986b: 31-42, 54-68; Culicover & Postal 2001; 
Boeckx 2012; inter alia). 
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que, por sua vez pressupõe sabermos quais dados são ou não são gerá- 
veis por G,. 

O problema da adequação explicativa é central na GGT. De nada adian- 
ta formularmos uma teoria com regras que prevejam corretamente todas 
e apenas as sentenças da língua se for logicamente impossível para a crian- 
ça descartar com certeza outras possibilidades de regras com base na sua 
experiência real (sem dados negativos). Esse parece ser exatamente o caso 
aqui. A exposição aos dados positivos é compatível também com uma gra- 
mática mais simples do que aquela com a proibição em (24b). Nessa gramá- 
tica hipotética, (17b) seria gramatical. O fato intrigante é que as crianças 
exibem o conhecimento de que (17b) seria impossível (logo, conhecimento 
de alguma versão de (24b) ou do que subjaz a isso), a despeito da ausência 
de evidência para tal. A fala infantil é repleta de supergeneralizações (e.g. 
*o sapato cabeu no meu pé por analogia a “a médica mexeu no meu pé), 
mas algumas jamais ocorrem, como a de produzir algo como (17b) siste- 
maticamente. Diante disso, é inescapável concluir que o sistema cognitivo 
da criança já é, desde o início, enviesado para levar em consideração os di- 
ferentes tipos de sentença subordinada para interpretar lacunas. 

O que é matéria de debate é a natureza desse viés: se (a) ele deriva de 
algum padrão cognitivo da inteligência geral (logo, aplicável a diversas ta- 
refas cognitivas não linguísticas) que restringe os tipos de analogia que se 
podem fazer, com base em fatores estabelecidos a priori como mais rele- 
vantes que outros; ou se (b) ele deriva do conhecimento inato de algum 
princípio cognitivo especificamente gramatical (tal como (24b)). A GGT 
tem acumulado muitas evidências empíricas em mais de meio século na 
direção da conclusão de que, para muitos fragmentos-chave das gramá- 
ticas das línguas (não todos, obviamente), a opção (b) é correta. Ou seja, 
há certos mecanismos gramaticais que não tivemos como aprender, mas 
os sabemos a despeito disso, portanto nascemos sabendo-os. De qualquer 
modo, independentemente de a opção correta ser (a) ou (b), o fato é que 
uma teoria linguística só é explicativamente adequada se ela contém uma 
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caracterização explícita do enviesamento apriorístico das crianças, que as 
leva a generalizar regras fazendo certos tipos de analogia e jamais outros, 
inclusive exibindo comportamentos universais nesse sentido, independen- 
temente da língua" em questão, Retomo esse ponto adiante em $5. 

O nível de adequação neurofisiológica (20iv) é atingido quando se tem 
uma teoria que é explicativamente adequada (consequentemente, adequa- 
da nos níveis observacional e descritivo), e cujos vieses cognitivos apriorís- 
ticos propostos (sejam eles definidos em termos de inteligência geral ou de 
habilidades inatas especificamente gramaticais) são compatíveis com o que 
as melhores teorias neurofisiológicas disponíveis apontarem como 'rea- 
lista”, em termos de sua instanciação no cérebro. Nesse estágio, deixamos 
de falar em mente e passamos a falar em cérebro, o que, de saída, nos coloca 
grandes obstáculos de incomensurabilidade entre as teorias e os métodos 
(cf. Poeppel 2012). Para que uma teoria atinja o nível de adequação evolu- 
tiva (20v), é preciso que ela, além de satisfazer os critérios de adequação de 
todos os quatro níveis inferiores, explique o porquê de a espécie homo sa- 
piens sapiens ter desenvolvido (via seleção natural), no curso da sua evolu- 
ção, o aparato neurofisiológico cerebral que desenvolveu, e não um outro, 
que acarretaria numa linguagem diferente da nossa. Essa explicação precisa 
ser compatível com os resultados gerais da teoria da evolução contemporá- 
nea quanto a mutações, seleções, adaptações, exaptações, etc. Sem dúvida, 
tudo o que há hoje a esse respeito é muita especulação e pouca conclusão 
(cf. Hauser et al. 2014). Retomo esses pontos adiante, em $2.8 e $5.6. 


52.7. CONCEPÇÃO DE LÍNGUA (LÍNGUA-I & LÍNGUA-E) 


Tomo como ponto de partida a concepção de língua de Saussure (1916), 
porque (i) ela norteou todas as pesquisas em linguística do Estruturalismo, 
tradição imediatamente anterior ao surgimento da GGT, e (ii) ela é um pon- 
to de referência conhecido de grande parte dos leitores típicos deste livro. 
Saussure — ao menos a persona histórica, o alter-ego reconstruído postuma- 
mente pelos discípulos que compilaram o Cours de Linguistique Générale 
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(CLG) — reconhecia a linguagem como heterogênea, multiforme, heterócli- 
ta, ao mesmo tempo individual e social, imensamente complexa e intangível 
por qualquer investigação humanamente exequível. Ao se impor a tarefa de 
delimitar o escopo da Linguística, ele reconheceu, de saída, que o objeto de 
estudo não precede o ponto de vista; ao contrário, o ponto de vista cria o 
objeto. Não se tratava de relativismo estéril, de negação de uma realidade 
cartesiana independente do observador. Todo processo de descoberta co- 
meça 'tateando no escuro; fazendo uma aposta semicega de que certas coisas 
pertencem ou não ao mesmo domínio da realidade. Os recortes epistemo- 
lógicos (e suas idealizações) são inevitáveis, do contrário nossas teorias não 
passariam de descrições tão complicadas quanto os fatos que pretendem 
explicar, incorrendo no problema do chamado Mapa de Borges”. 

Para Saussure, a linguagem (langage) é composta de língua (langue) e 
fala (parole). A língua seria o “sistema de signos, um código compartilhado 
pelos membros da sociedade, de alguma forma representado nas mentes 
dos indivíduos, mas “não é uma função do sujeito falante: é o produto que 
o indivíduo registra passivamente” (Saussure 1916: 30). Esse registro passi- 
vo seria parcial e imperfeito. A língua só existiria integralmente num plano 
exterior ao indivíduo, enquanto entidade social, tendo os indivíduos (mem- 
bros da sociedade) como veículos portadores de seus fragmentos. Saussure 
(1916: 30) afirma que: 


Se pudéssemos abarcar a união das imagens verbais armazenadas em todos os in- 
divíduos, atingiríamos o entrelaçado social que constitui a língua. Trata-se de um 
tesouro depositado pela prática da fala em todos os individuos de uma mesma 
comunidade, um sistema gramatical que existe virtualmente em cada cérebro ou, 
mais exatamente, nos cérebros de um conjunto de indivíduos, pois a língua não 
está completa em nenhum, ela não existe integralmente se não na massa. 


Em oposição à heterogeneidade da linguagem, a língua, assim consti- 
tuída, seria homogênea. O funcionamento do conjunto de convenções do 


50.CF. Del Rigor en la Ciencia (1946), do ficcionista argentino Jorge Luis Borges (que dia- 
loga com Sylvie and Bruno Concluded (1893) do ficcionista inglês Lewis Carroll), sobre um 
inútil mapa em escala real que replica toda a complexidade do território, sem lançar luzes 
sobre a compreensão dele (i.e. não ajuda na localização). 
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código pressupõe uma homogeneidade, sem a qual a língua não teria um 
caráter sistemático (op. cit.: 32). De onde vem a heterogeneidade da lin- 
guagem, então? Viria do uso do sistema. Enquanto a língua (sistema) seria 
homogênea, os usos que se fazem dela seriam variados. É na fala que resi- 
diria a variação linguística que confere heterogeneidade à linguagem. Cada 
ato de fala particular é uma das muitas instanciações da potencialidade de 
todos os usos do sistema. Saussure (1916: 38) afirma que “[nJão há nada 
de coletivo na fala, cujas manifestações são individuais e momentâneas”. 
Há casos bem simples, como a alternância entre (i) Aline vendeu o carro; 
(ii) Aline vendeu o automóvel; (iii) O carro foi vendido por Aline, e (iv) 
O automóvel foi vendido por Aline. Todas essas possibilidades previstas 
pelo sistema veiculam aproximadamente a mesma mensagem, estando a 
incidência de uma ou outra sujeita às escolhas de falantes particulares em 
circunstâncias particulares (ainda que sujeitas a modismos, etiqueta social, 
etc.). Assim, enquanto a língua seria social, a fala seria individual. 

Mas há casos de variação que desafiam esta visão. Discuto abaixo alguns 
exemplos, aqui rotulados como “2?” para contemplar diferentes possibilida- 
des de (in)aceitabilidade e (a)gramaticalidade, conforme cada dialeto do 
chamado “português brasileiro" (PB). 


(25a)?? Você quer que eu saia? (25b)2? Você quer que eu saio? 
(26a)?? Eu dei o livro pro meu pai. (26b)?? Eu dei o meu pai o livro. 
(27a)?? Ninguém leu o livro. (27b)?? Ninguém não leu o livro. 


(28)2? Ela está dormindinho no sofá. 


O primeiro par exemplifica a variação na expressão morfológica do 
modo subjuntivo. (25a) traz a variante “padrão”: saia. (25b) traz a variante 
não padrão (estigmatizada): saio, isomórfica à forma do presente do indi- 
cativo. Há dialetos (e.g. na periferia da região metropolitana de São Paulo) 
em que (25b) é a norma mais difundida, a ponto de (25a) soar demasiada- 
mente alheio ao vernáculo, algo aprendido na escola e pouco ou nada do- 
minado (como a mesóclise, por exemplo). No meu dialeto nativo (norma 
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urbana culta de Salvador-BA, geração nascida na década de 1970), (25b) 
soa bastante estranho, não familiar. O grau de aceitabilidade de (25b) por 
um falante do meu dialeto depende do seu grau de familiaridade com ou- 
tros dialetos. Eu, por exemplo, me acostumei com (25b) e compreendo, 
mas continuo estranhando, o que indica que a minha gramática pessoal não 
legitima esse arranjo morfossintático. O comportamento verbal da minha 
mãe, por exemplo, vai além. Ela generaliza a morfologia de subjuntivo para 
enunciados como Eu não sei se eu saia agora ou depois; que, aos meus 
ouvidos, soa tão estranho quanto (25b), embora eu esteja acostumado a 
isso e entenda. Ela me entende bem se eu digo Eu não sei se eu saio agora 
ou depois, mas ela vê (25b) como muito estranho, até difícil de entender, 
porque a forma verbal saio soa para ela como se estivesse no modo in- 
dicativo, uma asserção de que a pessoa sai, semanticamente incompatível 
com a condição de sentença subordinada ao predicado você quer que [...). 
Claramente, há no mínimo duas gramáticas (eu diria três ou mais) coexis- 
tindo no chamado PB quanto à expressão morfossintática do subjuntivo. 
Para muitos falantes, situados nos extremos do continuum sociolinguístico, 
a outra variante é inaceitável, indicando a impossibilidade daquela forma 
na gramática que eles dominam, sem tanta escolha individual. 

O segundo par ilustra uma variação em estruturas com verbos bitran- 
sitivos na voz ativa. (26a) é a forma típica, que a maioria dos falantes do 
chamado PB pensa ser a única”: objeto direto seguido de objeto indireto 
preposicionado. Em (26b), um objeto indireto não preposicionado precede 
o objeto direto. Essa variante não padrão é largamente desconhecida fora 
das poucas comunidades em que é usada”, e é julgada inaceitável pela gran- 


51. Quando digo única, excluo aqui, além da voz passiva, casos de fronteamento com ou 


sem clivagem ou TesamprRçO ou elipse (eg. Foi o livro que eu dei pra meu pai: Meu pai, 
) bem como a ordem não canônica com 
preposição, possível em casos de focalização contrastiva in situ do objeto direto (e.g. Eu dei 


52. Eg. dialeto da Zona da Mata Mineira (Scher 1996) e quatro dialetos rurais baianos 
(Lucchesi & Mello 2009). 
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de maioria dos brasileiros, para quem isso soa tão estrangeiro" quanto inglês 
maltraduzido (cf. [gave my father the book), tipicamente causando espanto 
e incompreensão ao primeiro contato. Para a grande maioria dos falantes, 
não há uma real escolha: apenas (26a) é reconhecida como “pertencente à 
língua que se fala. Mas há dialetos (minoritários) que legitimam (26b). 

Em (27a) temos a forma canônica de se dizer “Não existe uma pessoa 
x, tal que x leu o livro” no chamado PB. Semanticamente, a negação é sen- 
tencial, incidindo sobre a proposição “alguém leu o livro”, Morfossintati- 
camente, ela se realiza no pronome sujeito (cf. $4.4,3). Interessantemente, 
quando o pronome ninguém está em posição de objeto, o normal é expres- 
sar essa negação redundantemente, em duas posições, com o acréscimo da 
partícula não antes do verbo (i.e. O guarda não multou ninguém), sendo 
bastante estranha a ausência dela (i.e. *O guarda multou ninguém). Em 


(27b) temos a dupla expressão da mesma negação numa situação em que 
ninguém é o sujeito. Para a maioria dos chamados falantes do PB, essa es- 
trutura é inaceitável, o que sugere fortemente que, na(s) gramática(s) in- 
ternalizada(s) por essas pessoas, há regras que distinguem sujeito de objeto 
quanto às possibilidades de distribuição do pronome ninguém e da partí- 
cula não. Mais interessante ainda, para nossos propósitos aqui, é o fato de 
existirem alguns dialetos em que dados do tipo (27b) são possíveis, aliás 
um padrão presente em corpora de “português antigo". Claramente, tais 
dialetos têm uma gramática com outros mecanismos de negação. O fato 
de que há falantes que aceitam (27b) e o fato de que suas gramáticas são 
consideradas, do ponto de vista social, como integrantes do chamado PB 
não são suficientes para negar o fato de que, nas demais gramáticas, (27b) 
é agramatical. Os falantes que rejeitam (27b) não o fazem “por escolha”; 
fazem-no guiados por suas gramáticas*. 


53. CÍ. Vitral (1999: 68), Souza (2006: 70), Namiuti (2008: 162), Cavalcante (2012: 336) e 
obras lá referenciadas. 

54. É irrelevante para essa discussão se eventualmente houver usos de (27h), independen- 
temente do dialeto, com leitura equivalente a “Não há ninguém que não leu o livro” ou 
“Todos leram o livro”; pois o que importa aqui é a gramaticalidade de (27b) enquanto 
dupla expressão de uma mesma negação; não enquanto dupla negação. 
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Finalmente, consideremos (28), que, para muitos falantes, expressa algo 
próximo de Ela está dando uma dormidinha no sofá. O exemplo em questão 
traz o morfema de diminutivo -inh- inserido na forma verbal gerundiva 
dormindo. Tipicamente, esse morfema se restringe a nomes e adjetivos. Po- 
de-se argumentar que gerúndios são formas nominalizadas de verbos. Mas 
isso não muda o fato de que a construção em (28) é impossível na maioria 
das variantes do chamado PB, quaisquer que sejam as regras que proíbam 
isso. Passei a maior parte da minha vida sem jamais ter escutado algo desse 
tipo. Ao me deparar com esses dados pela primeira vez, estranhei muito. 
Depois, passei a interagir socialmente com falantes desse grupo (para quem 
gerúndios diminutivizados são plenamente aceitáveis e produtivos), e aca- 
bei me familiarizando um tanto com essa construção, que, contudo, nunca 
perdeu pra mim seu sabor de 'estrangeirismo. Em meu meio social, escuto 
com frequência dados desse tipo. Esporadicamente, por razões de empatia 
sociocomunicativa, arrisco falar desse jeito. Certa vez, um interlocutor me 
corrigiu por eu estar supergeneralizando a regra a casos em que ela não se 
aplicaria, como em verbos transitivos cujo objeto está explícito, não elíptico 
nem subentendido (e.g. *Ele tava lá beijandinho a namorada). Pensei ter 
fracassado no aprendizado da regra até descobrir que, para outros falantes, 
tal tipo de construção é plenamente aceitável (porém, não sem certas restri- 
ções, e.g. *dandinho um saída, *levandinho bronca, *tomandinho cuidado). 
Achei então que havia aprendido bem um entre (ao menos) dois dialetos 
do 'gerúndio-diminutivês, e não uma 'versão pirata” da gramática alheia. 
Entretanto, volta e meia, me pego em dúvida quanto a certas combinações 
específicas de auxiliar, verbo, objeto, etc. o que indica que eu tenha de fato 
internalizado alguma 'versão pirata” da gramática alheia. É preciso ressal- 
tar, porém, que, independentemente de a minha gramática ser deficiente/ 
incompleta quanto ao 'gerúndio diminutivizado; todos nós temos versões 
piratas das gramáticas uns dos outros. Pondo de lado, então, esses casos de 
microvariação e voltando aos casos de macrovariação, é um fato inescapável 
que a gramática de uns legitima (28), mas a gramática de outros não. 
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Eu poderia facilmente dedicar um livro inteiro apenas a descrever varia- 
ções gramaticais como essas. Mas os exemplos acima bastam para mostrar 
que muitíssimos tipos de variação/heterogeneidade residem na coexistên- 
cia de mais de uma gramática numa sociedade, sendo que cada gramática 
atribui um estatuto de (a)gramaticalidade distinto ao mesmo dado. Ao le- 
varmos em consideração conjuntamente mais e mais fenômenos como os 
ilustrados acima, fica evidente que, quanto mais abrangente for a base em- 
pírica que observamos (i.e. quanto maior a extensão geográfica abarcada, 
quanto mais faixas etárias considerarmos, mais classes socioeconômicas, 
etc.), mais provável é encontrarmos uma gama maior e mais variada de 
formas linguísticas. Inversamente, quanto mais restringirmos nossa obser- 
vação ao comportamento linguístico de grupos menores e menores (uma 
cidade, um bairro, uma família, um indivíduo), menos variação encontra- 
remos, Ou seja, quanto mais social é o que observamos, mais heterogêneo 
ele é; quanto mais individual, mais homogêneo. A conclusão inescapável 
disso é que havia um erro grave na concepção saussureana de que a lingua 
seria social e homogênea, e a fala individual e heterogênea. 

Pode-se reduzir o problema saussureano a uma magnitude mais solu- 
cionável, simplesmente concebendo-se diversas langues, diversos “sistemas 
gramaticais de signos" espalhados pelo “espaço lusófono"; afinal, o con- 
ceito de langue não necessita logicamente estar atrelado ao de país ou 
nação (cf. Saussure 1916: 270-280). Essa redução quantitativa, contudo, não 
resolve a natureza qualitativa do impasse. Isso seria o reconhecimento de 
que (sem negar que um tanto de variação advém mesmo de escolhas indi- 
viduais) a principal fonte de variação não está nos múltiplos usos de um 
mesmo sistema, mas sim na coexistência de múltiplos sistemas numa mes- 
ma sociedade, que permitem e proíbem diferentes arranjos de ILs*. 


55. Em alguma medida, Saussure (1916: 275-278) já reconhecia isso, ainda que parcialmen- 
te, quando afirmava que “[dJesde que se vem estudando cada fenômeno em si mesmo, 
mapeando a sua área de extensão, foi necessário substituir a antiga noção [de dialeto] por 
outra xistem apenas características dialetais naturais, não existem dialetos naturais; 
ou [...) há tantos dialetos quanto há localidades”. Basicamente, Chomsky leva esse racioci- 
nio ao limite e defende que existem tantas gramáticas quanto pessoas. 
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Na exposição acima, elegi quatro 'cantinhos” do espaço gramatical em 
que detectamos facilmente a existência de múltiplas gramáticas coexistin- 
do, havendo falantes que dominam apenas uma (ou muitas) das variantes 
das respectivas regras, de tal modo que muitos indivíduos não têm tanta 
escolha ao falar (ou têm muitas). Suas falas refletem as possibilidades que 
lhe estão disponíveis em suas gramáticas individuais. Alguns falantes po- 
dem ser mais 'poliglotas” ou mais 'monoglotas, por assim dizer, em relação 
a certos aspectos da gramática. Há centenas de outros aspectos gramaticais 
(fonológicos, morfológicos, sintáticos) que podemos (e devemos) levar em 
conta para chegarmos a um quadro mais completo e acurado da variação. 
Quanto mais completamos tal tarefa, mais combinações entre esses aspec- 
tos detectamos, e vemos granularidades cada vez mais finas de diferenças 
dialetais, correspondendo a numerosos sistemas impossíveis de serem as- 
sociados biunivocamente a uma região geográfica, e/ou faixa etária, e/ou 
classe socioeconômica, etc. 

A rigor, não há sequer um falante real dessa abstração chamada “por- 
tuguês brasileiro, que não pode ser observada na fala de ninguém. Pode 
parecer, a princípio, que isso corrobora a ideia saussureana de que a língua 
existe integralmente na sociedade e apenas parcialmente em cada indivi- 
duo. Contudo, na melhor das hipóteses, essa soma de sistemas gramaticais 
a que chamamos de “português brasileiro” seria um amontoado de sistemas 
gramaticais, agrupados por critérios sócio-histórico-políticos. Não seria 
um sistema gramatical, propriamente dito, caracterizável por critérios gra- 
maticais. Falta-lhe a homogeneidade que lhe conferiria a sistematicidade, 
segundo as próprias premissas saussureanas. No limite, haveria tantos sis- 
temas quanto indivíduos, o que nos leva ao cerne da proposta chomskyana. 

Para simplificar, ignoremos a explosão exponencial de gramáticas que 
emergem de centenas de espaços de variação gramatical entrecruzantes. 
Suponha que só há 30 aspectos na linguagem humana que podem variar 
(10 na fonologia, 10 na morfologia, 10 na sintaxe), e que em todos eles há 
apenas duas variantes possíveis (e.g. apenas a gente canta e nós cantamos; 
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ignorando-se nós canta, nós cantemo, etc.). O cruzamento de todas essas 
variáveis resulta em 2” possibilidades; ou seja, de acordo com essa estima- 
tiva artificialmente supermodesta, haveria 1.073.741.842 gramáticas logi- 
camente possíveis: um número mais de 5 vezes maior do que a estimativa 
oficial do IBGE para o total da população brasileira enquanto escrevo este 
parágrafo”. Ou seja, não é preciso muito para haver explosão exponencial. 

Obviamente, não se segue logicamente daí que todo indivíduo tenha 
uma gramática exclusiva”. Nada impede que membros de uma família, ou 
um grupo de colegas de escola compartilhem uma mesma combinação de 
possibilidades de cruzamento entre variáveis gramaticais. Também, nada 
impede que muitas dessas possibilidades de cruzamento acabem nunca 
existindo na prática, devido à ausência de fatores sociais que fariam uma 
variante gramatical 'se encontrar com outra, num dado espaço real de in- 
teração e comunicação efetivas. Entretanto, é fácil perceber que, havendo 
tantas dimensões de variação, e havendo tantas possibilidades de relações 
e interações sociais — inúmeras trajetórias possíveis que cada pessoa pode 
trilhar tendo ou não contato com inúmeros ILs, gírias, expressões idiomá- 
ticas, sotaques de vizinhos que migraram de outras cidades, ou cujos pais 
migraram, contato com moradores de fronteira ou não, etc. — fatalmente a 
variação oriunda de múltiplas gramáticas emergentes é uma consequência 
natural. No final das contas, cada indivíduo tem a sua gramática própria, 
que pode até coincidir com a de mais alguém, mas as coincidências são 
de pouca relevância diante da enormidade de gramáticas, todas elas erro- 
neamente tomadas como sendo “fragmentos incompletos da língua” numa 
perspectiva saussureana, pois todas elas se configuram num sistema gra- 
matical completo, com plenos recursos (lexicais, fonológicos, morfológi- 
cos, sintáticos) para expressar qualquer pensamento que o falante queira 
ou precise expressar. Conclusão: cada cabeça é um sistema, ou... minha gra- 
mática: minhas regras! 


56. CE http://wwwibge.gov.br/apps/populacao/projecao/ 
57. Também não se segue daí que um falante não possa ter mais de uma gramática (cf. n. 67). 
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E o que é então o português? E o japonês? E o yorubá? A rigor, o por- 
tuguês não existe! Nem o japonês, nem o yorubá, nem língua nenhuma. 
As “línguas” são ficções tanto quanto o conceito de raça biológica — negra, 
ariana, amarela, etc. (cf. Pena 2005; Sussman 2014; e Wade 2014 para um 
contraponto). Mas, mesmo admitindo a existência dessa imensa gama de 
múltiplos sistemas gramaticais (i.e. “cada cabeça é um sistema”), será que 
não seria igualmente inescapável admitirmos a existência de algo mais ou 
menos da ordem de grandeza do chamado “português; ao menos enquanto 
dimensão social dessas múltiplas gramáticas? Saussure (1916: 29) já dizia 
que “entre todos os indivíduos unidos pela linguagem, é estabelecida uma 
espécie de meio-termo; todos reproduzirão (não exatamente, é claro, mas 
aproximadamente) os mesmos signos unidos aos mesmos conceitos”. 

Esse meio-termo existe? Por que não podemos chamar isso de “português? 
Podemos, assim como podemos falar em “raça amarela” como um meio-ter- 
mo atrelado à coincidência de traços como olhos puxados, rosto redondo, 
cabelos lisos, etc.; mas isso não significa que raça amarela” seja mais que 
isso: um rótulo classificatório superficial, tanto quanto “língua portuguesa” 
o é. Em termos práticos, na vida cotidiana, essa concepção de reconhecer a 
existência do “português” é adequada, pois no dia a dia não está em jogo a 
granularidade fina da variação gramatical e suas origens. Em nada nos ajuda 
(aliás, só atrapalha) contestarmos que Cervantes e Borges escreveram em 
espanhol, Pessoa e Bandeira em português, Bronté e Hemingway em inglés. 
A questão é: qual é o estatuto teórico e ontológico desse meio-termo? 

Pessoas vivem em sociedade, a todo tempo interagindo no exercício de 
diversas atividades e se comunicando. Compartilham ideias, valores mo- 
rais, ideologias políticas, religiões, sensos estéticos, hábitos alimentares, e 
até micro-organismos que parasitam seus corpos. Quanto mais as pessoas 
convivem entre si, mais disso tudo elas irão compartilhar, incluindo itens 
de vocabulário, regras fonológicas, morfológicas, sintáticas e convenções 
pragmáticas de uso. Quanto maior a interação entre nós, mais semelhanças 
teremos em todos os aspectos da vida. Porém, o compartilhamento não é 
total. Cada indivíduo é único em relação a seu conjunto de crenças, valores, 
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objetivos; a como seu corpo interage com o meio físico; e também a como 
está configurada sua gramática mental. 

Ao fim, pessoas unidas por laços sociais fortes acabam apresentando va- 
lores culturais semelhantes (em contraste com alguém de um lugar distante, 
vivendo sob circunstâncias bem distintas), mas isso não torna todos iguais: 
as pessoas divergem significativamente quanto aos detalhes finos de suas 
visões de mundo, de tal modo que rótulos generalizadores (e.g. socialista, li- 
beral, conservador, libertário) são insuficientes para descrever alguém acura- 
damente, embora possam ser adequados para uma primeira caracterização 
aproximada. No plano linguístico, aqueles unidos por laços sociais fortes, 
por consequência dessas trocas sociais (em que, 'por tabela; são trocados 
elementos do léxico e da gramática), acabam possuindo gramáticas mentais 
distintas, porém suficientemente parecidas a ponto de haver a ilusão de que 
se fala 'a mesma língua, com compreensão mútua na maior parte do tempo 
a despeito de mal-entendidos que muitas vezes passam despercebidos. Há 
múltiplas gramáticas num continuum, e a distribuição delas (diatopicamen- 
te, diastraticamente, diacronicamente, diafasicamente), reflete em larga me- 
dida a complexidade da organização social. Mas essa teia de relações sociais, 
promotora de compartilhamentos, não é, em si, um sistema gramatical, e 
nem gera como produto um sistema gramatical unitário ao qual se possa 
chamar de 'língua portuguesa, japonesa, yorubá, etc. a menos que falemos 
em língua em termos mais frouxos, rótulos descritivos para essas constru- 
ções sociais ilusórias, tal como quando dizemos que “assistir a jogos de fute- 
bol aos domingos é um comportamento tipicamente brasileiro”. 

Feitas as considerações acima, chego ao ponto de apresentar a concep- 
ção chomskyana de língua, desenvolvida em muitas obras (e.g. Chomsky 
1964: cap 1; 1975b: cap 2; 1975c; 1980: cap 6; 1988: cap 1,2; 1991b; 1995b; 
2000a: cap 4, 5,6) e cuja explicitação canônica se encontra em Chomsky 
(1986a: cap 1,2). Em vez de citar vários trechos dessas obras aqui, peço que 
você as aprecie na integra. Para não “chover no molhado, ofereço, no que se 
segue, a minha leitura sobre o tema (que, ainda que não seja a única, está 
longe de ser exótica ou heterodoxa entre os pesquisadores da GGT, sendo 
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até em boa medida 'canônica'), fortemente calcada nos textos clássicos, e na 
minha prática como pesquisador da GGT. 

Tal como Saussure, Chomsky opera com as dicotomias “sistema & uso do 
sistema) “homogêneo & heterogêneo, e“individual & social” Porém, o modo 
como esses conceitos são articulados é bem diferente. Não raro, traçam-se 
paralelos entre Saussure e Chomsky de modo simplista e equivocado, esta- 
belecendo uma equivalência, de um lado, entre langue e competência, e, de 
outro lado, entre parole e desempenho. O paralelo não é de todo absurdo, 
posto que os dois primeiros conceitos dizem respeito ao sistema em sua 
potencialidade, enquanto os dois últimos se relacionam ao uso do sistema 
no ato de enunciação efetivo”. Mas há diferenças cruciais que, se igno- 
radas, levam ao absurdo. A langue saussureana era concebida como “ho- 
mogênea e social, enquanto a competência chomskyana é concebida como 
“homogênea e individual” É a partir daí que surge a dicotomia chomskyana 
Língua-I (I de Intensional (com S mesmo!) e Internalizada na mente/cérebro 
do Indivíduo) & Língua-E (E de Extensional e Externa à mente/cérebro do 
Indivíduo), que visa precisamente solucionar os problemas detectados na 
dicotomia saussureana original, como já exposto. 

A Língua-I corresponde à competência gramatical internalizada na mente 
de cada indivíduo (um indivíduo como eu e você, não um ser idealizado), o 
conjunto de regras e princípios de combinatória de elementos gramaticais 
atômicos para formar expressões gramaticais complexas, tomando-se essas 
regras e princípios em sua potencialidade gerativa, independentemente das 
limitações de desempenho. Haveria, portanto, no limite, tantas Línguas-l 


58. Em toda a sua vasta obra, há um ponto específico em que o próprio Chomsky (1964: 
10-11) chega a traçar um paralelo entre a competência e a langue como um recurso expo- 
sitivo, Adiante (op. cit.: 23), ele esclarece as diferenças, apontando inclusive que Saussure, 
embora sempre se referisse à langue como um sistema, não forneceu sequer um esboço de 
uma gramática efetiva que desse conta da capacidade gerativa desse sistema, concebido 
mais como um sistema de signos (i.e. um inventário de elementos) do que como um sistema 
de regras; ficando a combinatória aparentemente atribuída à parole (ou a alguma zona de 
fronteira nebulosa entre langue e parole), até onde se pode inferir algo a partir do texto obs- 
curo do CLG, compilado postumamente. Esse ponto é retomado pelo autor em trabalhos 
posteriores, notadamente em Chomsky (1986a: 19). 
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quanto indivíduos. A minha Língua-l é vista socialmente como sendo uma 
variante do chamado “português. Se você me entende, então você possui uma 
Língua-l que, embora distinta da minha nos detalhes finos, é suficientemente 
parecida com a minha a ponto de ser vista como uma outra variante do cha- 
mado “português. A minha Lingua-l é individual, e a sua também. É possível 
detectarmos as semelhanças e diferenças entre elas se as observarmos com 
o devido escrutínio, o que nos levaria a caracterizações do que vulgarmente 
chamamos de 'o meu dialeto do português" e “o seu dialeto do português. 
Aliás, é preciso detalhar isso ainda mais. O que é “o meu dialeto" e o 
que é “o seu dialeto'? Quem mais fala cada um desses dialetos? É fácil ro- 
tular o meu dialeto ou o seu com uma combinação de critérios relativos 
a idade, localização geográfica, nível (e tipo) de escolaridade, etc. Carac- 
terizar precisamente cada dialeto (suas regras fonológicas, morfológicas, 
sintáticas) é bem mais trabalhoso. Mas mesmo uma investigação incom- 
pleta do meu dialeto ou do seu — se feita de modo a efetivamente achar 
as diferenças e não apenas as semelhanças, o que crucialmente implica 
dar relevo aos dados negativos — evidenciará que é muito difícil encon- 
trar alguém que tenha uma Língua-1 exatamente como a minha ou como 
a sua entre aqueles que, pelos mesmos critérios já mencionados, seriam 
“os meus pares” e “os seus pares. Portanto, a noção relevante aqui não é 
dialeto, mas idioleto (grosso modo, o dialeto próprio de cada indivíduo), 
um conceito antigo, que, antes de Chomsky, e antes mesmo de Saussure, 
já havia sido considerado por Paul (1880) como o lugar por excelência 
onde jaz a gramática” /*”, Logo, o meio-termo no qual eu e você nos encon- 


59, A primazia do idioleto na teoria gramatical de Paul (1880) fora severamente criticada 
por Weinreich et al. (1968: 104-119), obra seminal da sociolinguística laboviana. Dados os li- 
mites de escopo e espaço, não tenho como comentar tal crítica, mas recomendo fortemente 
sua leitura, alertando para o fato de que a concepção de língua de Paul, embora similar à de 
Chomsky no que concerne à primazia do idioleto, é significativamente distinta da noção 
de Língua-l em vários aspectos. Logo, a crítica de Weinreich et al. à visão de Paul não ne- 
cessariamente é aplicável à de Chomsky. 

60.Crystal (1985: 142) observa que“ [a]lguns linguistas delimitam o uso do termo [idioleto] 
aos hábitos de fala de uma pessoa numa determinada variante [dialetal] num dado mo- 
mento”, Vemos aí, claramente, impressões digitais saussureanas na linguística estruturalista 
e pós-estruturalista como um todo. 


tramos é, concretamente, um meio-termo entre gramáticas individuais, 
ainda que elas sejam o que são em decorrência dos nossos históricos de 
experiências sociais com um grau considerável de sobreposição entre elas 
(cf. Hockett 1958, cap 38). Então, existem meios-termos, afinal? Haveria 
um meio-termo entre todos os meios-termos? Se todos interagimos social- 
mente nos comunicando, não seria exatamente por compartilharmos 
uma porção significativa do léxico e da gramática? Não seria isso, então, 
o que se convenciona chamar de 'a língua portuguesa"? A natureza disso 
não seria essencialmente social? Qual é o problema em reconhecermos 
isso? Por que não podemos equacionar isso com o conceito saussureano 
de langue? 

Sim, grosso modo, feitas as devidas ressalvas, é legítimo dizer que eu e 
você “sabemos português; e que 'português' é esse amálgama de gramáticas 
se interseccionando num “espaço sociossemiológico' no qual eu e você “nos 
encontramos: Isso é o que Chomsky chama de Lingua-E, e que se asseme- 
lha mais à langue saussureana. Essa entidade social exterior ao indivíduo, 
entretanto, não tem materialidade alguma para poder ser objeto de estudo 
da teoria da gramática; não é passível de ser estudada enquanto sistema 
gramatical porque não é um sistema gramatical, É um “balaio de gatos”. 
Por exemplo, todos aqueles dados em (25-28) acima são “sentenças do 
português" concebendo-se o português como Língua-E. Há dados naquele 
“balaio” que são gramaticais ou agramaticais, a depender da gramática em 
questão, do dialeto em questão; aliás, do idioleto em questão, pois dialeto 
já é uma idealização (uma espécie de langue menos abrangente, mas ain- 
da assim um amálgama de gramáticas). Ao considerarmos que tudo aquilo 
é “português, colocamos no mesmo “balaio” produtos de gramáticas dife- 
rentes: arranjos de ILs que são dados positivos numas gramáticas e da- 
dos negativos em outras. Claramente, a Língua-E não é uma gramática. É 
algo que, na melhor das hipóteses, com muito boa vontade, corresponde 
aproximadamente à definição bloomfieldiana de língua enquanto “coleção 
de todas as sentenças possíveis” (ou fórmulas sentenciais possíveis, como 
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Nome'Verbo"Nome, Nome” Negação” Verbo” Pronome, Artigo” Nome” Ver- 


bo"Nome" Advérbio, etc.). 

A Língua-E, portanto, é extensional, em oposição à Língua-l, que é in- 
tensional. Para todo e qualquer dispositivo gerador de produtos, existem as 
engrenagens internas do sistema que, se acionadas, geram os produtos; e 
existem os produtos geráveis pelas engrenagens acionáveis. Uma cafeteira 
automática tem como a sua intensão toda a sua estrutura física, recipientes, 
circuitos elétricos, engrenagens mecânicas, etc.; e tem como sua extensão 
todos e apenas os tipos de café que ela está programada para fazer (com 
água ou leite, mais forte ou fraco, com ou sem açúcar, etc.). Cada tipo de 
café (espresso, cappuccino, macchiato, mocha, latte, cortado, pingado, etc.) 
é, por assim dizer, uma “sentença! gerável pela “gramática” da cafeteira. Por 
analogia, o que a máquina reconhece como itens lexicais combináveis se- 
riam os grãos de café, água, leite, açúcar, etc. Não adianta colocar vodka, 
limão e açúcar nos recipientes e apertar o botão esperando que a máquina 
gere uma caipirinha, que é “agramatical” para ela, já que a sua intensão não 
inclui mecanismos que gerem tal produto. 

O chamado “português” é tão somente a coleção das extensões de muitas 
gramáticas que — por critérios sócio-históricos e não gramaticais — são tidas 
como pertencendo a uma mesma “língua! Adaptando um dito famoso atri- 
buído a Max Weinreich, pode-se dizer que uma língua (i.e. Língua-E) é um 
dialeto com uma unidade monetária, forças armadas, e uma extensão terri- 
torial para chamar de suas. Isso é uma simplificação, obviamente. Línguas-E 
não precisam corresponder exatamente a um país. Podem corresponder a 
unidades sociais de um mesmo país politicamente dividido; ou a uma socie- 
dade relativamente unida que extrapola fronteiras de países. A depender da 
leitura sócio-político-histórica que façamos, podemos falar em “português' 
como uma língua única de toda a comunidade lusófona, ou podemos falar 
em uma língua brasileira) distinta das demais variedades da lusofonia. 

Diversos linguistas defendem a existência de uma “língua brasileira” in- 
dependente segundo critérios gramaticais. De fato, em diversos aspectos 


98 


(estrutura silábica, distribuição de pronomes, tipos de sujeito oculto pos- 
síveis, conjugação verbal, etc.), é possível identificar que certos tipos de ex- 
pressão (extensões) só existem no Brasil. Logo, a noção de “língua brasileira” 
não é assim tão descabida, nem é construída artificialmente somente por 
critérios sócio-político-históricos. Porém, muitos não se dão conta de que, 
por esses mesmos critérios gramaticais, pode-se falar em múltiplas “línguas” 
distintas dentro do Brasil, com intensões e extensões claramente distintas 
(nem tudo o que existe em uma também existe na outra, e vice versa), em- 
bora haja uma interseção significativa entre elas. E aí? Devemos instituir 
logo de uma vez que existem as línguas baianês, mineirês, gauchês, goianês, 
etc.? Por coerência, deveríamos ainda reconhecer a independência entre o 
baianês do sul, baianês do norte, baianês do litoral, baianés da minha gera- 
ção, da geração dos meus avós, etc. Por que não? 

Inversamente, por que não conceber uma única “língua do mundo lusó- 
fono' da qual o brasileirês' seria um dialeto com semelhanças e diferenças 
entre os demais? Afinal, há interseção entre as variantes internacionais. Ape- 
sar dos mal-entendidos de praxe (que, em menor escala, ocorrem também 
entre “falantes de PB), eu já me comuniquei satisfatoriamente com portu- 
gueses, angolanos e moçambicanos. Outras vezes, os mal-entendidos são 
enormes. Como traçar a linha que demarca a fronteira entre uma língua e 
outra? Grau de compartilhamento de recursos lexicais e gramaticais? Identi- 
dade cultural? Unidade política? Inteligibilidade mútua? Como medir isso? 
Também já me comuniquei satisfatoriamente com espanhóis, chilenos e co- 
lombianos. E aí? A esse respeito, remeto o leitor a Chomsky (1986a: cap 2) 
para uma argumentação sólida sobre o quão fracassadas são as tentativas de 
se delimitar uma língua por sua extensão. Para nossos propósitos imediatos, 
ilustro esse ponto com uma passagem de uma obra recente que ataca for- 
temente a concepção chomskyana de linguagem e linguística, considerada 
pelo autor como “mitologia; e não como ciência. Ironicamente, em relação 
a esse ponto específico das fronteiras entre línguas, o fragmento abaixo de 
Evans (2014a: 65-66) converge com a posição chomskyana. 
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Há hoje entre 6 mil e 8 mil línguas faladas no mundo. É dificil precisar quantas 
são, Isso se dá porque é inerentemente complicado determinar se um modo 
de falar conta como um dialeto de uma língua ou como uma língua própria. 
Pode-se pensar que um jeito trivial de decidir isso seria através do critério da 
inteligibilidade mútua. Um falante de inglês norte-americano pode (em boa 
medida) entender um falante de inglês britânico. Em contraste, um falante 
monolíngue de francês não consegue entender um falante de inglês (de qual- 
quer variedade). Por essa medida, os “ingleses: norte-americano e britânico são 
dialetos de uma única língua, enquanto inglês e francês contam como línguas 
distintas. Entretanto, identidade cultural e considerações sociopolíticas tipica- 
mente intervém. Sérvio e croata são consideradas línguas distintas por pessoas 
da Sérvia e da Croácia, respectivamente. Mas elas são mutuamente inteligíveis, 
e diferem entre si menos acentuadamente que as variedades norte-americana e 
britânica do inglés. Um colega meu de Nis, na Sérvia, chegou a me dizer que ele 
acha mais fácil entender falantes da capital da Croácia, Zagreb, a uma distância 
de 650km, do que alguns dialetos sérvios, falados de 80 a 100km de Nis, no su- 
deste da Sérvia. Em contraste, Mandarim e Cantonês são considerados dialetos 
do chinês pelo governo da China, embora a inteligibilidade mútua entre eles 
seja relativamente pequena. 


Enfim, há, infelizmente, um apego infundado à tradição saussureana, 
ainda presente mesmo entre os que alegam ter outras afiliações teóricas 
significativamente distintas do modelo saussureano. É esse apego (numa 
roupagem contemporânea qualquer) que nos impede de seguir fragmen- 
tando a língua e descer até o nível do idioleto, reconhecendo que o único 
sistema gramatical que possui a homogeneidade que Saussure atribuía à 
langue é a Língua-I. Ocorre, porém, que a Língua-l, diferentemente da lan- 
gue, é individual (uma entidade psicológica, não social) e intensional (i.e. 
não é uma coleção de produtos). 

Esse olhar chomskyano, cuja curvatura da lente deixa o social fora de 
foco, na visão periférica, enquanto o individual é magnificado e examina- 
do escrutinadamente num plano fechado, tem sido alvo de fortes ataques 
desde sempre (cf. Bezuidenhout 2006, para uma análise elucidativa). Mais 
uma vez, valho-me convenientemente da obra de Bagno, cujas críticas à 
GGT (e a Chomsky especificamente) sintetizam em si todo um espectro 
de mal-entendidos comuns, em boa parte oriundos de dogmas extensio- 
nalistas e antiformalistas. Ainda que Bagno (201 la: 360-363; 2012: 44-47) 
também critique explicitamente a noção de langue como demasiado idea- 
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lizada, ele revela ter uma concepção de língua com traços saussureanos (e 
labovianos) claros: basicamente a insistência na negação do idioleto como 
o lugar por excelência da gramática, e a idealização insustentável de que 
existe materialidade em algo tão abrangente e etéreo como “a língua portu- 
guesa) ainda que, diferentemente de Saussure, e similarmente a Laboy, ele 
rejeite a premissa da homogeneidade do sistema. Eis o que Bagno (201 la: 
363) diz sobre a seletividade chomskyana quanto aos dados considerados: 
[A] competência [e o] desempenho que ele propõe não é outra coisa [...] se- 
não a língua que ele mesmo, Chomsky, conhece, fala e escreve, isto é, o inglês 
americano padrão. Com irritante frequência, a atribuição do rótulo de agra- 
maticalidade a determinadas construções só se explica porque essas constru- 
ções não pertencem à variedade linguística urbana de prestígio falada pelo 
linguista. [...] Ora, essa facilidade de atribuição (em tudo ideológica) do rótu- 
lo de agramaticalidade não é muito diferente da atitude do purista normativo 
que diz, por exemplo, que determinada palavra ou frase 'não existe” ou “não é 


portugués” simplesmente porque não foi incluída na norma artificialmente 
forjada para servir de padrão. 


Essa irritação com as atribuições de agramaticalidade frequentes é reve- 
ladora de uma grande incompreensão generalizada da obra chomskyana. 
Ao falar em alta frequência, Bagno sugere ter lido muito da vasta obra de 
Chomsky. Face à sua incompreensão de conceitos básicos, fica flagrante 
que Bagno leu bem menos do que sugere ter lido (se leu muito, tanto pior, 
porque não compreendeu). Não há motivo racional para se irritar com a 
frequência de algo infrequente. De fato, atribuições de agramaticalidade 
são frequentes na obra de Chomsky (como vimos, explicitar dados nega- 
tivos é imprescindível), mas, em geral, com poucas exceções, trata-se de 
dados em torno dos quais diferenças dialetais são nulas ou mínimas”, ou 


61. Há exceções, é claro, como, por exemplo, na sua análise clássica da morfossintaxe do 
sistema verbal do inglês (Chomsky 1955a, 1957), em que os exemplos de “inversão do au- 
xiliar' e “inserção de do” incluem dados do tipo (i) Have you read books?, (ii) Are you rea- 
ding books?, e (iii) Do you have books?; excluindo dados do tipo (iv) Do you be reading 
books? e (v) Have you books?. O dado (iv) é um equivalente a (ii) em “inglês vernacular 
afro-americano”; enquanto (v) é um equivalente a (iii) em dialetos do Reino Unido, Tais 
variações dialetais já foram analisadas por outros autores no âmbito da GGT com base no 
mesmo aparato teórico-analítico desenvolvido por Chomsky, feitos os devidos ajustes. A 
rigor, nada está sendo subtraído! 
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de dados em torno dos quais as divergências de aceitabilidade gradual são 
generalizadas para todos os dialetos (cf. Chomsky 1982a; Chomsky 1986b). 
Esta passagem de Bagno — aliada a outras (cf. n. 31, 37) — sugere que a base 
empírica de Chomsky se constituiria apenas do “inglês padrão; o que é falso. 
Em pontos cruciais, ele analisa exemplos externos ao “inglês' (com frequên- 
cia bem menor, mas em pontos-chave da teorização), e costuma se valer 
muito frequentemente das descrições e análises de outros pesquisadores da 
GGT, a partir de bases empíricas grandes e variadas, incorporando tais re- 
sultados às suas próprias teorizações (e.g. Chomsky 1982b: 74-83). A GGT 
é um empreendimento coletivo, no qual Chomsky, pessoalmente, contribui 
menos para a adequação observacional e mais para a adequação descritiva e 
explicativa, embora ele próprio tenha descoberto muitos fatos importantes, 
presentes, sob formas variadas, em diversas línguas; a partir de observações 
da “norma urbana culta do inglês norte-americano da costa leste. 

É infundada a acusação de que Chomsky teria nefastas motivações ideo- 
lógicas para o seu recorte da base empírica. Seu intenso ativismo políti- 
co sempre foi contrário à chamada “supremacia da elite burguesa cauca- 
siana judaico-cristã ocidental”=. Também é absurda a comparação entre 
Chomsky e os normativistas. Bagno se incomoda que, ao ser selecionada 
uma variedade do “inglês, certos dados são rotulados como agramaticais 
mesmo que sejam gramaticais em outras variedades. Há incompreensões 
múltiplas nisso. Cobra-se tacitamente de Chomsky uma descrição do in- 
glês enquanto Língua-E: uma coleção exaustivamente inclusiva dos arran- 
jos de ILs que, do ponto de vista da percepção coletiva ingênua, seriam 
todos sentenças do inglês. Na medida em que Chomsky está descrevendo 
intensões de gramáticas, e que os dados são apresentados para ilustrar o 


62. Ao criticar a visão elitista de língua e sociedade de Bernstein (1975), Chomsky (1979: 
56) diz: “O trabalho de Bernstein me parece reacionário em suas implicações e talvez nem 
mereça ser discutido enquanto instância de estudo racional sobre a língua. Há muito tenho 
acreditado não ser mais necessário afirmar que o linguajar falado numa periferia urbana 
é uma língua genuína. Mas talvez ainda o seja. Certos educadores parecem levar a sério a 
hipótese de que há graves limitações na competência [gramatical] de crianças das classes 
mais baixas”. 
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que os sistemas investigados geram ou não geram como suas extensões, é 
logicamente impossível fundir múltiplas gramáticas como se fossem uma 
só, com requerimentos contraditórios. 

O erro crasso de Bagno decorre de não perceber que dados negativos 
são tão importantes quanto os positivos para a compreensão dos sistemas 
gramaticais. Descrever uma língua fictícia em que “vale quase tudo” exige 
operar majoritariamente com dados positivos, ignorando a maioria dos 
dados negativos, reveladores de proibições importantes, presentes de modo 
mais rígido ou mais frouxo em diferentes gramáticas. A atitude de Bag- 
no é que é normativista: cria-se artificialmente uma “língua” na qual, por 
decreto, diversas estruturas devem ser incluídas na força bruta, tornando 
impossível uma descrição gramatical formalizada, abrindo assim caminho 
para abordagens pós-modernas de língua, calcadas em conceitos vagos que 
não fazem previsões testáveis, posto serem demasiado extensionais. Bagno 
expressa sua irritação como se a idealização metodológica de se isolar uma 
variedade para se descrever um aspecto-chave da gramática fosse um ato 
irracional de fé na existência de uma comunidade linguística homogênea 
composta apenas por falantes ouvintes ideais (todos iguais), forjados a par- 
tir das intuições do próprio pesquisador apenas (cf. n. 37, 67)”. 

Deve-se ressaltar que esse tipo de recorte feito por Chomsky e demais 
pesquisadores da GGT é lugar-comum em diversas práticas de teoria e aná- 
lise gramatical não chomskyanas, como GPSG (Gazdar et al. 1985, et seq.), 
HPSG (Pollard & Sag 1994), LFG (Bresnan 2001, inter alia), ou Gramática 
Categorial (Moortgat 1988; Morrill 1994). Isso se dá porque é impossível 
hipotetizar uma gramática explícita que faça previsões testáveis acerca dos 
arranjos (im)possíveis de ILs se não for isolada uma extensão para a qual 


63. É surpreendente que Bagno (201 1b) muito sensatamente diga que “existem tantas lín- 
guas quantos são os habitantes de um país”, sem perceber que essa afirmação correta con- 
tradiz suas outras declarações. Ainda que ele tenha querido se referir a múltiplas normas 
de uma mesma língua (cf. Faraco 2008), a contradição é inescapável, pois não haveria na 
língua uma única intensão compatível com a união das extensões das normas. 
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seja logicamente possível haver uma intensão que forme um todo inter- 
namente coerente (embora, nesses outros quadros teóricos, não haja uma 
preocupação com a realidade psicológica da gramática”, não existindo, 
pois, um correlato exato do conceito chomskyano de Lingua-l). 

Faz-se pertinente aqui um esclarecimento sobre um aspecto da teoriza- 
ção gramatical chomskyana que frequentemente é alvo de mal-entendidos. 
Se, a rigor, não existe 'o inglês, e se só as Línguas-l são passíveis de in- 
vestigação, então não seria um contrassenso os chomskyanos formularem 
análises sobre “a inversão entre o sujeito e o verbo auxiliar em perguntas do 
inglês? Isso é literalmente ilógico. Mas, no âmbito da GGT, quando se fala 
em 'o inglês ou o português; trata-se de uma convenção terminológica de 
conveniência que não se pode tomar literalmente. Ocorre que, em meio a 
todo o “balaio de gatos” que o senso comum toma como sendo “o inglês, 
há muitíssimas Línguas-l distintas cuja união das extensões corresponde a 
uma Língua-E. Embora distintas, essas Línguas-l também guardam seme- 
lhanças importantes. Para alguns aspectos gramaticais, ocorre que todas as 
Linguas-l que subjazem a uma dada Língua-E coincidem. Por exemplo, em 
“português” o artigo sempre precede o nome com que se relaciona, nunca o 
contrário (e.g. “o tambor, “tambor o). Nesses casos, chamar tudo de “por- 
tuguês' é um atalho expositivo trivial. 

Há muitos casos bem mais complexos, com várias gramáticas em uso 
numa população socialmente coesa, com inteligibilidade mútua, e uma 
distribuição das variedades dialetais difícil de isolar, em razão de critérios 
extragramaticais: local, idade, grau de escolaridade, etc. Nesses casos, cha- 
mar tudo de português" é bem menos trivial, embora seja igualmente le- 
gítimo desde que o escopo e os objetivos da pesquisa estejam claros”. Ou 


64. Em certos casos, rejeita-se explicitamente a abordagem psicológica, e defende-se o es- 
tudo da gramática como um objeto puramente matemático (e.g. Gazdar et al. 1985: 1-16). 
Isso sim é que é platonismo extremo! 


65. Cf. adiante, $3.1, a discussão em torno dos exemplos (9) e (10) do capítulo seguinte. 
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seja, “português” pode ser um rótulo de conveniência para nos referirmos 
aos aspectos gramaticais sob investigação, isolando-se uma subpopulação 
considerada, do ponto de vista da Língua-E, como falante do chamado 
“português. Ou seja, “português” frequentemente equivale a “a variedade 
do português que estou pesquisando: Tipicamente, essas descrições vêm 
acompanhadas de 'o dialeto X do português, especificando-se X. De fato, 
por vezes há um certo descuido em se detalhar na descrição os recortes fei- 
tos (diatópico, diastrático, diafásico, diacrônico), dando margem a críticas 
razoavelmente pertinentes. No entanto, como veremos logo adiante, esses 
rótulos são de menor importância na perspectiva da GGT porque, em últi- 
ma instância, o que se está de fato investigando não é este ou aquele dialeto, 
nem mesmo este ou aquele idioleto, mas a Faculdade da Linguagem, parte 
da capacidade cognitiva humana. As “línguas específicas, como quer que 
as classifiquemos, são estudadas enquanto etapas intermediárias para se 
chegar a algo mais abrangente”, Retomo esse ponto adiante. 

Haveria, para Chomsky, algo equivalente à parole? Grosso modo, cada 
ato de enunciação individual é algo como uma instância de parole, um 
ato individual de uso do sistema gramatical, uma produção de extensão a 
partir da intensão. Porém, para Chomsky, não é daí que advém a hetero- 
geneidade da linguagem. As falas dos indivíduos, embora não totalmente 
homogêneas (pois há margem de manobra, opcionalidades previstas pela 
própria Língua-l, desvios de desempenho, etc.) são majoritariamente ho- 
mogêneas enquanto instanciações particulares de potencialidades da gra- 
mática daquele indivíduo, e não da gramática de outrem (exceto nos casos 
em que alguém mimetiza a gramática alheia, e mesmo assim ele o faz de 
acordo com a sua própria 'versão pirata” individual de tal gramática). Há, 


66. Diante das minhas colocações neste capítulo, creio que tenha ficado claro o porquê de 
eu utilizar sistematicamente aspas simples nas expressões língua(s), português, inglês, japo- 
nês, etc., ressaltando que tais conceitos não têm aqui o mesmo estatuto teórico que têm nas 
abordagens não chomskyanas. Mantenho essa convenção notacional neste capítulo para 
marcar posição. Nos próximos capítulos, utilizarei tais termos sem aspas, em prol da flui- 
dez da leitura, mas pressuponho que o leitor terá sempre em mente o conteúdo desta nota. 
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ainda, a possibilidade de um mesmo indivíduo ser competente em mais 
de uma gramática. Isso é muito mais evidente em casos de filhos de pais 
que são, cada um, falante nativo de uma “língua” distinta, permitindo que a 
criança internalize duas “línguas” nativas, tornando-se bilingue stricto sen- 
su. Ela pode ainda ter três “línguas” nativas, caso ela tenha crescido num 
ambiente onde se fala uma terceira “língua” distinta das dos pais. O mesmo 
pode acontecer de modo menos perceptível. A depender de sua trajetória 
de vida na infância e juventude, um mesmo falante pode ter desenvolvido 
múltiplas Línguas-I que são todas socialmente tidas como “variedades do 
português, Logo, muito da variação na fala de um indivíduo pode não 
ser variação intragramatical, mas fruto da opção de se usar uma ou outra 
gramática, a depender do contexto discursivo-pragmático”. Trata-se de 
code-switching (troca de código), uma ideia muito criticada por Weinreich 
et al. (1968: cap 3) e Labov (1972: cap 8). De fato, atribuir toda a varia- 
ção na fala de um mesmo falante a code-switching pode ser exagero, posto 
que gramáticas podem fornecer opções. Porém, diante dos incontestáveis 
casos reais de bilinguismo pleno, não há nada que impeça, logicamente, 
que uma pessoa fale vários idioletos bem parecidos, cada um sendo usado 
no momento oportuno, conforme a competência pragmática. Trata-se de 
uma questão empírica, afinal. 

Uma vez definidos os conceitos básicos que constituem a concepção 
chomskyana de língua, resta finalmente esclarecer qual é exatamente o 
objeto de estudo da GGT. A exposição acima deixa claro que nem o de- 
sempenho nem a Língua-E se constituem em objetos de estudo possíveis 
nessa perspectiva (embora sejam fontes de observação de dados brutos). 
Os conceitos de competência e Língua-l se fundem, e, por constituírem 
o lugar onde jaz a intensão da gramática, parecem reunir as propriedades 
necessárias para serem tomados como o objeto de estudo da GGT. Mas a 


67. Segundo Chomsky (1975c: 318), “[nJo mundo real, não há comunidades de fala ho- 
mogêneas, e sem dúvida todo falante domina de fato várias gramáticas [...)”. Ver também 
Chomsky (1984: 40-42) para uma elaboração. 
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questão é um pouco mais complexa. Conforme já discutido acima, a GGT 
não estuda o falante ouvinte ideal enquanto um ser fictício. Estudam-se 
falantes reais como eu e você, porém abstraindo-se certos fatores, ideali- 
zando-nos como falantes sem a interveniência de fatores de desempenho. 
O que isso significa? Será que, seguidos os devidos protocolos metodológi- 
cos de isolamento de variáveis, a GGT estuda gramáticas individuais? Seria 
o objetivo da GGT catalogar descrições de milhões e milhões de Línguas-l 
mundo afora, cada uma tomada individualmente, sem relação alguma com 
as Línguas-] de outros indivíduos? Não. Embora se possa estudar cada Lín- 
gua-l separadamente, a GGT não busca uma catalogação de Línguas-l sem 
relação alguma entre elas. 

Que relação de conexão entre elas seria essa, já que a Língua-E é colo- 
cada fora do escopo de investigação? Estudar Línguas-l está para a GGT 
assim como estudar o meu cérebro ou o seu está para a neurologia. A 
GGT estuda competências individuais como uma forma de capturar o real 
objeto de estudo, que é a capacidade cognitiva da espécie homo sapiens sa- 
piens para o desenvolvimento e uso de competência gramatical. Em última 
instância, o objeto de estudo é o que se chama de Faculdade da Linguagem, 
cuja existência Saussure (1916: 24-27) já reconhecia, embora isso para ele 
ficasse fora do objeto de estudo. Para ele (op. cit.: 26), “pode-se dizer que 
não é a linguagem falada que é natural ao homem, mas a faculdade de se 
constituir uma língua”, Para Chomsky, essa faculdade de se constituir uma 
língua já seria, ela própria, uma espécie de protogramática dada pela dota- 
ção biológica da espécie, um conjunto de mecanismos gramaticais básicos 
que subjazem a toda e qualquer Língua-l humanamente possível. Isso se 
relaciona com a noção de Gramática Universal, que discutirei adiante (cf. 
$5), e que é objeto de muitas polêmicas e mal-entendidos. 

Nessa perspectiva, a GGT promove explicitamente um divórcio entre 
a teoria da gramática e as disciplinas das Humanidades. Esse “divórcio” é 
também um movimento de retorno parcial a perspectivas pré-saussurea- 
nas de liguagem como algo interno à mente em oposição a uma entidade 
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social. Embora a maior parte da concepção chomskyana de linguagem seja 
bastante original, Chomsky reconhece explicitamente que as origens de 
suas ideias remontam a pensadores de tempos mais remotos, como Pla- 
tão (424aC-348aC), R. Descartes (1596-1650), W. Humboldt (1767-1835), 
inter alia (cf, Chomsky 1966: 52-59; 1968: 1-23; 1975b: cap 1, 2; 1988: 1-17, 
cap 5; 1991b; 1995b; 20004, cap 4, 5, 6)”. A contraparte desse “divórcio” é a 
promoção de um “casamento” entre a teoria gramatical e a psicologia. Aliás, 
a psicologia seria a “mãe adotiva” da teoria gramatical, tal que a segunda é 
subparte da primeira, ainda que a segunda não tenha historicamente surgi- 
do da primeira (cf. Chomsky 1979: 43-44), Isso já estava explícito desde pelo 
menos Chomsky (1965: 4): 


Para o linguista, assim como para a criança adquirindo a língua, o problema 
consiste em se chegar, a partir dos dados de desempenho, ao sistema subja- 
cente de regras internalizado pelo falante-ouvinte e que ele põe em uso no 
desempenho real. Logo, no sentido técnico, a teoria linguística é mentalista, 
na medida em que visa descobrir uma realidade mental subjacente ao com- 
portamento observável. 


Tal mentalismo implica que a GGT seja um ramo da psicologia. Direto ao 
ponto, Chomsky (1975c: 304) afirma que “[a] gramática postulada pelo lin- 
guista, assim construída, é uma teoria psicológica”. Mais contextualizada- 
mente (cf. $2.8), Chomsky (1988: 6) afirma: 


As três primeiras questões [cf. (29i/ii/iii) adiante] pertencem ao domínio da lin- 
guística e da psicologia: dois campos de investigação que eu prefiro não distin- 
guir, tomando a linguística (mais precisamente, as áreas da linguística das quais 
me ocupo aqui) como tão somente aquela parte da psicologia que lida com os 
aspectos particulares dessa disciplina delineada nessas três questões. 


Essa ideia de que há uma base cognitiva especializada para a gramáti- 
ca que subjaz a qualquer Língua-l possível (consequentemente, exibindo 
reflexos indiretos nas Línguas-E) faz a previsão de que, embora haja dife- 


68. Como contraponto, recomendo a dura crítica de Hamans & Seuren (2010) a Chomsky 
quanto à sua concepção da genealogia das suas próprias ideias. Antecedentes dessa crítica 
encontram-se já em Searle (1972). 


renças entre as “línguas, haveria em todas elas certas propriedades univer- 
sais, inexoravelmente presentes (superficializando-se de forma mais evi- 
dente ou menos, a depender da interação com outros fatores) por serem 
determinadas biologicamente. Para além da questão empírica de haver 
mesmo tais universais ou não, há uma questão teórica e metodológica 
que se coloca, e em torno da qual tem havido muitos mal-entendidos 
desde os primórdios da GGT, em que oponentes atribuem a Chomsky 
declarações que ele jamais fez. Cito um exemplo recente e muito popular. 

Em seu livro que pretende demonstrar que a linguística chomskyana 
seria anticientífica, constituída de uma série de “mitos” Evans (2014a: 15, 
64,93) afirma que, segundo Chomsky, as propriedades dessa matriz gra- 
matical biológica poderiam ser investigadas observando-se apenas uma 
única “língua; posto que, por definição, os universais linguísticos esta- 
riam presentes em todas elas. Esta afirmação é escandalosamente falsa, 
e repousa na premissa (igualmente falsa, fruto de um erro crasso de in- 
terpretação típico de quem não leu o que está criticando) de que os uni- 
versais linguísticos necessariamente seriam diretamente observáveis nos 
produtos da extensão das gramáticas, como se eles fossem propriedades 
das sentenças produzidas. 

A concepção chomskyana de universal linguístico diz respeito à inten- 
são das gramáticas. Certos princípios de combinação de elementos seriam 
propriedades de toda e qualquer Língua-l. Isso teria um impacto na forma 
das sentenças produzidas, e somente através da observação de enunciados 
dessas sentenças é que se pode ter evidência empírica da presença de tais 
princípios numa gramática. Entretanto, o modo como uma gramática se 
organiza como um todo — seus aspectos universais e particulares, e a in- 
teração entre eles — faz com que a observação dos universais linguísticos 
não seja algo tão trivialmente detectável nos dados. Detectar universais lin- 
guísticos implica considerar a interação entre regras, que pode ofuscar ou 
evidenciar os efeitos umas das outras. Erros semelhantes — não distinguir 
entre universais formais e substantivos (Chomsky 1965: 27-30) e entre uni- 
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versais greenbergianos e chomskyanos” — abundam também em Evans & 
Levinson (2009), e foram devidamente abordados por comentaristas que 
publicaram suas respostas no mesmo volume. 

O livro de Evans (2014a) é dirigido a leigos e estudantes, e tem atingido 
muito sucesso, gerando grandes debates públicos em plataformas da inter- 
net”, Suas afirmações repetem velhos e recorrentes mal-entendidos, com 
uma nova roupagem (cf. Ackerman & Malouf 2016; Berent 2016; Deen 
2016; Hinzen 2016; Wijnen 2016). É grave e falsa a acusação de que, na vi- 
são chomskyana, bastaria observar uma única língua para se concluir algo 
sobre os universais da intensão da protogramática mental”, Nos referidos 
debates acalorados na internet, Evans é pressionado a fornecer citações de 
obras de Chomsky em que tal afirmação teria sido feita. Evans então des- 
tacou o seguinte fragmento de Chomsky (1980c: 47-48): “Para os exemplos 
que acabo de examinar, não hesitei em propor um princípio geral de estru- 
turação linguística com base na observação de uma única língua”. Como 
apontado no debate por David Pesetsky e David Adger, esse fragmento 
foi escandalosamente recortado fora de contexto. No mesmo parágrafo, 
Chomsky segue afirmando: 


A inferência é legitima assumindo-se que os humanos não são especificamente 
adaptados para aprender uma língua e não outra (e.g. inglês em vez de japonês). 
Assumindo que uma Faculdade da Linguagem geneticamente determinada é 
uma capacidade comum aos membros da espécie, podemos concluir que um 
princípio da linguagem é universal se a lógica do raciocínio nos leva a postulá-lo 


69. Sobre essa distinção, cf. Homnstein (2013, 2014e, 2015b). Os primeiros referem-se ao 
que Berwick & Chomsky (2016) chamam de fenótipo da gramática: generalizações sobre 
padrões nas formas superficiais de dados das extensões das gramáticas. Os segundos refe- 
rem-se aos mecanismos comuns às intensões de todas as gramáticas, atestáveis parcialmen- 
te e indiretamente no fenótipo, dada a interação entre regras universais e particulares que 
tornam seus mecanismos mais transparentes ou mais opacos a depender do caso. 

70.Cf. Evans (2014b, 2014c), Dunbar et al. (2014), Hornstein (2014a, 2014b, 2014c, 2014d, 
2014e, 2015a, 2015b); Pereltsvaig (2015a, 2015b, 2015c, 2015d). 

71. Para uma refutação contundente, recomendo os artigos de Adger (2015a, 2015b): 
o primeiro uma crítica direta a Evans (2014a), o segundo uma tréplica a uma réplica de 
Behme & Evans (2015). 


no 


como “precondição' para a aquisição de uma língua qualquer. [.] Para sub- 
metermos tal conclusão a teste, teremos naturalmente que investigar outras 
línguas num nível de detalhamento equivalente (grifo meu, MG]. 


Casos como esse abundam na literatura técnica, sendo que muitas ve- 
zes a afirmação complementar que dá sentido ao todo não se encontra na 
mesma página. Permita-me dizer o óbvio: para compreender Chomsky é 
preciso ler Chomsky, e muito! Aqui, mostro o “caminho das pedras) mas se 
ele não for percorrido, não se chegará muito longe. 

Independentemente de quais sejam as reais causas dos mal-entendi- 
dos por parte dos antichomskyanos, noto que muitas distorções do que 
Chomsky supostamente teria dito decorrem de (i) falta de leitura; e (ii) um 
apego irracional a ideias preconcebidas e equivocadas acerca do conceito 
de falante-ouvinte ideal, da importância dos dados negativos, e da distin- 
ção entre intensão e extensão. Isso gera mal-entendidos gigantescos que, 
passados adiante, se transformam numa narrativa mitológica acerca das 
supostas ideias de Chomsky, segundo a qual os universais linguísticos, por 
estarem presentes na gramática de qualquer indivíduo falante de qualquer 
língua, poderiam ser integralmente estudados observando-se uma única 
Língua-l de um falante de uma única Língua-E. Isso é tão absurdo quanto 
dizer que os neurologistas podem concluir tudo sobre a estrutura do cé- 
rebro da espécie homo sapiens sapiens observando o cérebro de uma única 
pessoa, ainda que seja verdade que o cérebro de toda e qualquer pessoa 
(excetuando-se casos-limite, como lesões com perda de massa encefálica, 
etc.) exiba as propriedades universais determinadas pelo genoma humano. 

Conclusão: o “ar místico; a “idealização excessiva" e a “intangibilidade” são 
bem maiores numa visão de língua baseada em supostas entidades sociais 
como “o português. A visão chomskyana envolve um alto grau de idealiza- 
ção, como em todo empreendimento científico; entretanto, ela prevê que a 
realidade das “línguas” seja um matiz com um número gigantesco de possi- 
bilidades, exibindo uma granularidade fina de múltiplas variedades, tal que 
nenhuma gramática humanamente possível é redutível a uma classificação 
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estanque, forjada por critérios sociopolíticos alheios à gramática em si. Isto 
é muito mais realista e empiricamente sustentado do que a visão do senso 
comum de que “línguas teriam realidade concreta, podendo ser contadas, 
medidas, ou diretamente observadas através de atos de fala. 

Por fim, sinalizo que há, nesta seção, uma lacuna em relação ao debate em 
torno do caráter homogêneo ou heterogêneo da língua, e de sua natureza 
ser individual ou social. Além de Chomsky, outros autores diagnosticaram 
a inconsistência na concepção saussureana de língua como “homogênea e 
social” Entre eles, William Labov se destaca. Seu trabalho, iniciado na dé- 
cada de 1960, logo após o surgimento da GGT, tem tido enorme influência 
em quase tudo o que se produz hoje sobre variação e mudança linguística. 
Para a Sociolinguística Variacionista laboviana, a língua (enquanto sistema, 
não uso) seria social, mas heterogênea”, A sistematicidade não pressuporia 
homogeneidade. Ao contrário, o funcionamento do sistema adviria das re- 
gras variáveis socialmente encaixadas, cujos produtos dependem dos fatores 
condicionadores, todos dentro de um mesmo sistema heterogêneo. 

Essa visão difere da concepção chomskyana de sistema como 'homogê- 
neo e individual. Não surpreende que Labov tenha feito críticas fortes à vi- 
são chomskyana, que repercutem até hoje. Nesse caso, não se trata de “pitacos 
desinformados. O olhar laboviano sobre a distribuição das várias formas de 
uma mesma expressão, e sobre o quanto isso pode nos fazer compreender a 
mudança linguística, foi um avanço substancial e merece ser comparado ao 


72. Por um lado, como aponta Lucchesi (2015: 33), Labov rejeita as premissas da sociologia 
durkheimiana presentes na concepção saussureana de língua como fato social “externo ao 
indivíduo e que a ele se impõe”, e a reconcebe “colocando o falante como agente da mudan- 
ça, através de suas reações subjetivas às variantes”. Por outro lado, como também aponta 
Lucchesi (2015: 51), “Labov e os sociolinguistas definiram seu objeto de estudo como a 
comunidade de fala”. Isso legitima a classificação “social, mas heterogêneo” da visão labo- 
viana de língua. Lucchesi (2011, 2015: 48-52) faz uma comparação direta das semelhanças 
e diferenças entre Chomsky e Labov de um modo que eu não endosso, mas que reconheço 
ser uma interpretação séria sobre as conquistas e as limitações de cada modelo, e sobre o 
desafio que se impõe à linguística geral de resolver certas tensões entre aspectos sociais e 
cognitivos da linguagem. 
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olhar chomskyano com o devido cuidado e detalhamento”. Infelizmente, 
tal tarefa extrapola em muito o escopo deste livro. Adiante (cf. $5.7), tecerei 
alguns comentários cabíveis a esse respeito, a propósito da apresentação da 
dicotomia chomskyana “princípios & parâmetros, relativa aos limites da va- 
riação e invariância em diferentes gramáticas. 


52.8. AS CINCO PERGUNTAS FUNDAMENTAIS DA GGT 


Uma vez estabelecidos o escopo da investigação e seu objeto de estudo, 
os métodos de investigação, e a hierarquia de níveis de adequação a serem 
atingidos, podemos formular explicitamente as cinco perguntas centrais da 
GGT. Cada uma delas se desdobra em múltiplas subperguntas acerca dos 
detalhes de cada um desses fenômenos que, juntos, constituem a lingua- 
gem natural humana”. 


(29) (i) De que se constitui o conhecimento gramatical G de um indivíduo E 
(ii) Como G se forma no curso do desenvolvimento cognitivo de I? 
(iii) Como G é posto em uso por 1 em interação com os demais aspectos 
não gramaticais de percepção e cognição? 
(iv) Quais são os correlatos neurofisiológicos de G no cérebro de E 
(v) Como tal aparato neurofisiológico se desenvolveu no curso da evolução 
da espécie? 
Esta é uma adaptação da formulação de Chomsky & Lasnik (1993), 
um texto clássico em que se faz um balanço da década antecedente 
da GGT, e se delinciam diretrizes para pesquisas futuras. Numa das 


73. Chomsky (1979: 54-57) não compartilhava dessa opinião, e via o paradigma laboviano 
como pouco relevante. Chomsky (20004: 156) revê tal posição e afirma que a sociolinguís- 
tica é uma investigação totalmente legítima. 

74, Esses cinco questionamentos têm sido chamados respectivamente de (i) Problema de 
Humboldt, (ii) Problema de Platão, (iii) Problema de Descartes, (iv) Problema de Broca, e 
(v) Problema de Darwin-Wallace; nomeados a partir de eminentes pensadores ocidentais 
que investigaram diferentes grandes questões; das quais cada um dos cinco questionamen- 
tos da GGT seria parte. Para uma sintese disso, com as referências bibliográficas indicativas 
das origens dos nomes desses'problemas, remeto o leitor a Grohmann (2015: 3). 
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obras-chave do período avaliado, Chomsky (1986a: 3) explicitara as três 
primeiras perguntas, já postas em obras anteriores de modo mais difu- 
so, desde a década de 1960. A quarta pergunta já havia sido explicitada 
em Chomsky (1988: 3,133). 

A resposta ideal para (i) apontaria todos os exatos meios mentais de 
combinação de ILs em expressões complexas, i.e. a Língua-1. Desde o iní- 
cio, a GGT tem avançado muito nesse sentido, descobrindo padrões gra- 
maticais que antes passaram despercebidos, havendo uma ampliação da 
base empírica sem precedentes na história da teoria gramatical”, Ainda 
que haja um misto de boas e más análises para muitos desses padrões, o 
simples fato de o arcabouço teórico-analítico da GGT permitir a desco- 
berta desses muitos fatos é sinal de que a GGT é, no mínimo, uma meta- 
linguagem descritiva muito frutífera e reveladora, e, no máximo, o melhor 
caminho rumo a ótimas respostas a subperguntas da pergunta geral em 
(i). Respostas para (ii) vêm sendo desenvolvidas através de estudos experi- 
mentais (cf. $2.4) que levam em conta vários fatores extragramaticais (e.g. 
limitações de memória, percepção, etc.) presentes nos atos de produção 
e percepção de fala (cf. Fodor et al. 1974; Cowart 1997; Lewis & Phillips 
2015; Sprouse & Hornstein 2014). A resposta da GGT para (iii), desde 
meados da década de 1960, consiste em argumentos racionais calcados em 
vasta evidência empírica (boa parte oriunda de estudos experimentais) 
corroborando a hipótese de uma Gramática Universal (GU) inata, que se- 
ria parte do sistema referido em (i), representada na mente da criança des- 
de o nascimento, e que se completa via experiência de exposição a dados 
de línguas" particulares. A criança — tendo sido exposta aos dados a que foi 
exposta e não tendo sido exposta aos dados a que não foi - acaba internali- 
zando aquela Língua-l específica, e não qualquer outra, por uma interação 


ilhas, lacunas parasitas, extração across-the-board, subjacência, sluicing, clitic clim- 
localidade nas dependências de longa distância de deslocamento (minimalidade re- 
lativizada, superioridade), restrições sobre a correferência de anáforas, pronomes e SNs 
referenciais, controle, alçamento, crossover, reconstrução, antecedent contained deletion, 
PRO-gate, ilhas de LF, e muitos outros casos e subcasos. 
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de fatores, um deles sendo um conjunto geneticamente determinado de 
princípios cognitivos de natureza exclusivamente gramatical (i.e. a GU), 
os outros dois sendo as idiossincrasias da experiência daquela criança com 
seu meio social imediato, e habilidades cognitivas (e físicas) próprias da 
espécie homo sapiens sapiens que não são exclusivamente voltadas para a 
gramática”, A GU conteria princípios rígidos e universais, bem como um 
(limitado) espaço de variação (cf. $5.7 adiante). 

Quanto às três primeiras questões (cf. Chomsky 1986a: 3), há um longo 
caminho adiante, mas muito já foi feito. Quanto às duas últimas, Poeppel 
(2012) e Hauser et al. (2014) demonstram que respostas plenas ainda estão 
muito distantes. No entanto, dado o seu objeto de estudo, GGT não pode 
se furtar a tentar respondê-las. Se a conclusão da investigação da questão 
(iii) é o inatismo gramatical, firma-se um compromisso com a biologia, o 
que desencadeia as questões (iv) e (v). Qualquer que seja o formato de GU 
proposto, ele precisa ser compatível com o que as ciências naturais apon- 
tam como sendo biologicamente possível. Na versão mais recente da GGT, 
o Programa Minimalista (PM), tornou-se possível ambicionar um dia atin- 
gir um nível de adequação supraexplicativo”, com respostas para as ques- 
tões (iv) e (v), já postas antes (implícita ou explicitamente). No seio do PM, 
floresceu a Biolinguística, cuja origem remonta a Lenneberg (1960, 1964, 
1967). A atual posição de Chomsky quanto a isso encontra-se sumarizada 
em Berwick & Chomsky (2016), em que se atesta uma enorme diferença 
qualitativa entre a comunicação humana e a dos demais primatas, apon- 
tando para um salto evolutivo que só seria plausível se toda a complexidade 
da GU se resumisse a uma mutação simples que envolvesse um minimum 
minimorum de alteração cognitiva, dado o estreito parentesco entre o homo 
sapiens sapiens e os demais primatas. E se isso lhe soa como uma grande 


76. Esses seriam os três fatores-chave que moldam a linguagem, segundo Chomsky (2005: 6). 


77. Cf. Chomsky (2000b, 2004, 2005, 2007), Boeckx (2006a, 2010), Hornstein (2009), 
Piattelli-Palmarini et al. (2009), Larson et al. (2010), Bolhuis & Everaert (2013), Di Sciullo 
& Boeckx (2011), Berwick & Chomsky (2016). 
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novidade, leia Chomsky (1982b: 18-23) — produzido ainda em 1979 — e 
aprecie uma clara manifestação do embrião dessa ideia. 

Como contraponto, recomendo que o leitor se informe sobre a recente 
pesquisa conduzida por César Ades, Didier Demolin e Francisco Mendes 
sobre vocalizações nos primatas Muriquis (Brachyteles hypoxanthus), que 
exibem padrões de sequenciamento de símbolos que parecem exigir no 
mínimo o equivalente a regras sintagmáticas recursivas, e talvez um tanto 
mais que isso (i.e, regras moderadamente sensíveis a contexto estrutural)”, 
Se isso for verdade, tem-se aí um desafio significativo à conjectura de Ber- 
wick & Chomsky (2016). 


78. Cf. Ades et al. 2007; Mendes et al. 2010; Demolin et al. (2010, 2011). 
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S$3. Estruturas Sintáticas 


83.1. GRAMÁTICA GERATIVA: O QUE É, PARA QUE SERVE, E COMO 
SE (REJCONSTRÓI 


Investigar a linguagem humana em termos de uma gramática gerativa 
envolve asserções ousadas sobre a natureza de aspectos centrais da cogni- 
ção na espécie homo sapiens sapiens. A visão cartesiana que norteia nosso 
fazer científico e o caráter explícito das nossas hipóteses colocam-nos em 
constante estado de vulnerabilidade, pois qualquer contraexemplo escan- 
cara uma falha de formulação. Fica a sensação de que “a conta não fecha”. 
Quem não compreende a cientificidade da GGT vê isso como um defeito 
imperdoável e incorrigível. 

Entretanto, essas feridas abertas” são, ao contrário, uma grande virtude. 
A GGT não dispõe de “poções mágicas” que forjam seu estancamento via 
pseudoexplicações holísticas, apelando para supostas conexões obscuras e 
não testáveis entre gramática e discurso, psicanálise, história, antropologia, 
política, etc.' Assim, a parte da conta que 'não fecha” nos aponta claramente 


1. Não se trata de negar toda e qualquer conexão entre gramática e outros fenômenos (cf. 
$2.2). O problema está no apelo a tais fatores como um deus ex machina que miraculo- 
samente “explica” o funcionamento da linguagem negando a existência de mecanismos 
gramaticais determinantes, assumindo que há múltiplos fatores em ação que só apontam 
tendências. Tal “teoria” não é testável, sendo imune a críticas, porque todo e qualquer dado 
parece compatível com ela, já que ela não prevê categoricamente que nada seja impossível 
(cf. Popper 1963). A eficácia de tais abordagens é ilusória. No confronto de ideias na acade- 
mia, elas são tão intelectualmente honestas quanto um convite para se jogar um jogo cuja 
regra é “par eu ganho, ímpar você perde”. 


onde acertamos e onde erramos, e nos guia na direção de aparar arestas, 
lapidar a duríssima pedra bruta passo a passo, rumo a uma compreensão 
sólida e genuína da gramática das línguas naturais, em termos de modelos 
matemáticos cada vez mais rigorosos. 

Em muitos pontos mais dificeis em que ainda somos incapazes de pro- 
ver um formalismo totalmente explícito, permitimo-nos semiformaliza- 
ções (categorias, regras, princípios, etc., calcados em nossas ferramentas 
cotidianas de diagramação arbórea e afins) imprecisas nos planos de ade- 
quação superiores, porém satisfatórias nos inferiores, dando assim o pri- 
meiro passo lógico rumo a explicações genuínas (cf. Chomsky 1982b: 75-79, 
100-103; 1990: 145-146; Smith 2004 [1999]: 147-150). Mas há o compromisso 
constante de, tão logo consigamos descrever bem o padrão com um jargão 
semiformal, formalizarmos efetivamente o fenômeno, fazendo previsões 
cada vez mais explícitas e testáveis, saindo aos poucos da clausura da caver- 
na guiados pela chama da razão. Não se faz isso nas trevas do empiricismo 
destituído de compreensão da dimensão transcendente aos dados brutos, 
nem nas trevas do transcendentalismo puramente matemático desvincula- 
do da realidade empírica. 

Retomemos a analogia anterior (cf. $2.7) entre uma cafeteira automáti- 
ca e a gramática de uma Língua-l. A cafeteira tem como a sua intensão toda 
a sua engrenagem interna; e sua extensão são todos e apenas os tipos de café 
que ela é capaz de fazer (com água ou leite, mais forte ou fraco, com ou sem 
açúcar, etc.). Cada tipo de café é uma 'sentença” gerável pela 'gramática' da 
cafeteira, que reconhece como ILs combináveis os grãos de café, a água, o 
leite, o açúcar, etc., mas não, por exemplo, vodka ou limão. Uma caipirinha 
não é gerável pela cafeteira, logo é 'agramatical, não apenas pelos ILs irre- 
conhecíveis, mas também porque faltam mecanismos para gerá-la (e.g. um 
cortador e amassador de limões). 

Suponha que estamos num passado remoto em que não existe cafeteira 
automática. Imagine então que alguém acaba de inventá-la. Há apenas um 
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exemplar da máquina, que, por fora, é uma “caixa preta; com botões, por- 
tas de entrada para os ingredientes, e uma torneira de onde sai o café. 
Ponha-se no lugar de um empresário interessado em fabricar a cafeteira 
em série, Você faz uma proposta ao inventor quanto ao uso da patente e 
participação dele nos lucros das vendas. Ele diz não ter interesse algum, 
pois criou a máquina para uso próprio apenas. Após insistência, ele faz a 
contraproposta de lhe dar de graça os direitos de patente desde que você 
seja capaz de construir uma réplica da máquina apenas observando ela 
funcionar. Você pode examinar minuciosamente todos os ingredientes e 
todos os produtos da cafeteira (pode até submetê-los a uma análise quimi- 
ca laboratorial), pode experimentar combinações de botões, mas não pode 
abrir a máquina para examinar suas engrenagens internas. Mesmo com 
auxílio de excelentes engenheiros e baristas, seu desafio é enorme! 
Desvendar a estrutura de uma gramática é similar. Conhecemos razoa- 
velmente bem os ingredientes dos quais sentenças são feitas (i.e. os ILs), 
bem como o formato geral das sentenças, que tipos de IL se combinam mais 
proximamente com quais outros, suas relações de precedência, as conexões 
de significado entre eles, as marcas de concordância que eles portam. É fácil 
examinar a curva melódica do enunciado falado; podemos medir detalhes 
finos de pronúncia de cada consoante ou vogal num laboratório de foné- 
tica, Os significados das sentenças são majoritariamente claros. Embora 
nos seja difícil precisar exatamente sua ontologia e estrutura interna numa 
metalinguagem técnica, sabemos bem o que cada sentença “quer dizer. Os 
“ingredientes! e as “bebidas prontas” de uma “máquina mental de gerar sen- 
tenças' não nos são tão misteriosos assim. Quanto às engrenagens internas 
da gramática, não temos nenhuma evidência direta, apenas indícios frag- 
mentados e confusos. A tarefa parece fácil diante de uma sentença simplória 
como Pedro corre, para a qual qualquer programador de software amador 
propõe um cálculo formal em que 'a conta fecha! Tão logo encaramos dados 
um pouco mais complexos, a magnitude do desafio é evidente, demanda o 
trabalho árduo de gerações de pesquisadores, que hipotetizam sucessivas 
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réplicas imperfeitas do “gerador mental de sentenças; aperfeiçoando-as até 
se obter uma que seja descritivamente adequada (cf. $2.6: (19ii); $2.8: (28i)) 
tanto quanto possível. 

Um dos requisitos cruciais para se atingir adequação descritiva é a répli- 
ca ser capaz de gerar tudo e apenas aquilo que o dispositivo a ser replicado 
gera. No caso da cafeteira, a réplica perfeita é aquela que produz todos e 
apenas os tipos de café que a cafeteira original prepara. Se a réplica deixar 
de gerar algum tipo de café, ela falha porque subgera, i.e. gera menos do 
que o esperado. A réplica sobregera se ela falhar no sentido contrário, i.e. 
gerar algum produto diferente daquele que a máquina original gera. Do 
mesmo modo, nossa réplica do “gerador mental de sentenças, i.e. a nossa 
teoria da gramática, não pode subgerar nem sobregerar; deve gerar todas 
e apenas as sentenças da Língua-l em questão, prevendo para cada uma os 
significados e as prosódias a elas associados. Em (1) e (2), ilustro a seguir 
esse procedimento a partir de um fragmento da gramática de um dialeto 
coloquial do PB. 


(la) Y Maureen beijou Ringo. (1b) “ Maureen beijou ele. 
(2a) “ Ela beijou Ringo. (2b) Y Ela beijou ele. 


Todas as sentenças significam que houve um ato de beijar que afetou um 
homem cuja identidade é explícita em (la) e (2a), mas não em (1b) e (2b), 
executado por uma mulher cuja identidade é explícita em (la) e (1b), mas 
não em (2a) e (2b). No nível observacional, constata-se que [sujeito” ver- 
bo“objeto] é a ordem canônica nessa gramática, o que é corroborado pe- 


los dados negativos a seguir": (1c) * Maureen Ringo beijou; (1d) *Ringo 


2. O estatuto de agramaticalidade dos arranjos de ILs a seguir refere-se à interpretação 
indicada. Para nossos propósitos imediatos, é irrelevante, por exemplo, que uma versão de 
(Id) com uma pausa após Ringo seja gramatical com uma interpretação equivalente a Por 
falar no Ringo, Maureen beijou ele; tampouco importa se (1º), (1j), (29) e (2j) são gramati- 


cais com o sentido de que Ringo é quem beija e Maureen a beijada. 
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Maureen beijou; (le) *Beijou Ringo Maureen; (1f) *Ringo beijou Mau- 
reen; (1g) * Maureen ele beijou; (1h) * Ele Maureen beijou; (1i) *Beijou ele 
Maureen; (1) “Ele beijou Maureen; (2c) * Ela Ringo beijou; (2d) * Ringo ela 
beijou; (2e) *Beijou Ringo ela; (2f) * Ringo beijou ela; (2g) * Ela ele beijou; 
(2h) *Ele ela beijou; (2i) *Beijou ele ela; e (2j) *Ele beijou ela. Esse mini- 


corpus sugere que a gramática subjacente seja algo como (3)': 
(3) [a] S5SNºSV; [b] SN5(DY'N; [c) SV2V'(SN) 


Cada regra legitima um agrupamento no qual uma unidade maior (à 
esquerda da seta) contém unidades menores (à direita da seta, dispostas na 
ordem estabelecida pela regra como a legítima para que o agrupamento se 
dê). Grosso modo, o pouco que temos formalizado até aqui corresponde à 
análise da gramática pedagógica tradicional, que reconhece a sentença (i.e. 
S em (3a)) como composta de um sujeito imediatamente seguido de um 
predicado (i.e. SN e SV em (3a), respectivamente); um verbo (i.e. V em 
(30)) que é o “núcleo do predicado”; um objeto do verbo (i.e. SN em (3c)); 
e nomes (ou pronomes) que são os núcleos do sujeito ou do objeto (i.e. N 


em (3b)). Os diagramas em (4) explicitam o paralelo*. 


3.S= sentença; SN = sintagma nominal; SV = sintagma verbal; N = nome; e V = verbo. Os 
parênteses em (3c) indicam que o SV pode conter um SN seguido a V ou não, conforme 
a (in)transitividade do verbo (cf. “ Ela dormiu, “Ela beijou Ringo. “Ela dormiu Ringo). 
Em Chomsky (1955a: 121), a opcionalidade é indicada por parênteses angulares'< >! Em 
Chomsky (1951: 8-9), há uma distinção sutil entre “( )'e'< >! A mesma opcionalidade há 
em (3b) em relação ao D(eterminante) — e.g. artigo —, já que em vez de Maureen e Ringo 
poderíamos ter q bela e a fera. A (impossibilidade de coocorrência de artigo com nome 
próprio (e.g. a Maureen) varia conforme o dialeto considerado. Uso aqui meu dialeto na- 
tivo por pura conveniência. 

4. Por razões expositivas, omito outras possibilidades de análise (e.g. [º SNºV"SN] 
ou [* [S” SN*V]'SN]) cujo descarte precisaria ser fundamentado empiricamente e teorica- 
mente com rigor. Retomo esse ponto em $4.4.2. 
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(4a) Sentença (4b) s 


Ss as 
Sujeito Predicado SN sv 
I PAS | sá 
N V Objeto N vV SN 
Maureen/ela beijou | Maureen/ela beijou | 
N N 
Ringo/ele Ringo/ele 


Até aqui, foi conveniente tratar pronomes como equivalentes a SNs não 
pronominais em nossa álgebra gramatical. Isso se justificava pelo fato de 
pronomes poderem ser sujeito ou objeto, comportando-se tal qual SNs não 
pronominais. Contudo, diante dos dados em (5) — que representam o meu 
dialeto coloquial de referência — vemos que a gramática em (3) enfrenta 
sérios problemas, pois sobregera (5a) e subgera (5b). 


(5a) * Maureen beijou me. (5b) “ Maureen me beijou. 


Quanto à subgeração de (5b), isso parece ter fácil solução postulando-se 
uma quarta regra que legitima que o objeto preceda o verbo, como na gra- 
mática em (6). 


(6) [a] S2SN'ºSV;  [b]SN5(D)'N; [e] SVV(SN);  [d] SV>(SN)'V 


Embora a gramática (6) dé conta da geração de (5b), persiste o proble- 
ma de (5a) ser prevista como gramatical (gerável por (6c) = (3c)), embora 
seja agramatical. Além disso, a regra (6d) sobregera dados negativos como 
(1c), (1g), (2) e (2g), agravando o problema. Basicamente, a gramática hi- 
potetizada legitima dois 'esqueletos estruturais distintos, sendo que ambos 
parecem necessários à primeira vista, mas ela não tem meios de controlar 
como os ILs podem ou não preencher tal esqueleto. O problema está des- 


crito em (7): 
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(7a) s (7b) 5 


E a O a 
SN sv SN sv 
| cdi | Edo! 
N 4 SN N SN av 
Maureen/ela beijou | Maureen/ela I beijou 
N N 
Y Ringo/Y ele/"me 


Yme/"ele/*Ringo 


Parece tentador buscar a solução num acréscimo de regras tal que pro- 
nomes seriam elementos distintos dos demais SNs, pertencendo a uma 
categoria própria: Pron. Pode-se, assim, hipotetizar uma regra parecida 
com (6d), porém legitimando a ordem sujeito-objeto-verbo apenas para 
objetos pronominais (i.e. SV>(Pron)"V). Isso bloqueia a sobregeração 
de dados como (lc) e (2c), mas o problema da sobregeração de (lg) e 
(2g) persiste. Além disso, para prever a geração de dados como (1b), (2a) 
e (2b), as regras (6a=3a) e (6c=3c) teriam de ser replicadas em novas re- 
gras contendo Prox em lugar de SN (i.e. SPron'SV e SV5V"(Pron)). 
Esse problema fica tanto maior quanto mais ampliarmos a base empíri- 
ca, considerando todos os casos em que pronomes e SNs podem ocupar 
as mesmas posições. A proliferação de “regras irmãs” acaba revelando o 
quanto, apesar de atingirmos adequação observacional, fracassamos no 
objetivo de atingir adequação descritiva, pois a numerosa lista de regras 
coincide com os muitos tipos de dados encontrados. Isso seria descrever a 
extensão do sistema num jargão técnico em vez de desvendar de fato qual 
éa intensão do sistema. 

Uma tentativa parecida, porém menos dramática, seria isolar o tipo de 
pronome que apresenta um ordenamento excepcional em relação ao verbo, 
identificando os membros desse conjunto (i.e. me, te, se, lhe, nos...) e con- 
cebendo uma categoria gramatical própria para eles, a que podemos rotu- 
lar de Ost em alusão ao que a gramática pedagógica tradicional chama de 
“pronomes oblíquos) que têm uma distribuição mais restrita, não podendo, 


por exemplo, ocorrer em posição de sujeito (e.g. *me sou linguista) ou ser 
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regidos por preposição (e.g. “ela deu o livro para me)*. Nossa nova hipótese 
para a gramática seria tal como (8). Ao reexaminar os dados acumulados 
até então, o leitor constatará que essa nova gramática não exibe os mesmos 
problemas de subgeração e sobregeração apontados anteriormente. 


(8) [a] S2SN'SV;  [b]SN5(DYN; [e] SV5V(SN);  [d]SV(OsL)'V 
Já desvendamos o enigma? Longe disso! Encaremos o próximo desafio. 


(9a) * Lola fez [eu sorrir] (9b) * Lola eu, fez [ 9, sorrir] 
(10a) * Lola fez [me, sorrir) (10b)Y Lola me, fez [ 9, sorrir] 


Tenha em mente que os indicadores de (a)gramaticalidade acima res- 
tringem-se ao meu dialeto de referência. (9a) é gramatical em certos dia- 
letos/idioletos”, assim como (10a) o é em outros”. A depender de como a 
gramática de cada dialeto/idioleto se organiza internamente (e.g. restrições 
quanto ao infinitivo flexionado, aspectos morfoprosódicos de pronomes 
átonos, estratégias de focalização, morfologia de caso, etc.), é possível que 
um falante aceite apenas (9a); ou apenas (10a); ou apenas (10b); ou (9a) 


5. A “pergunta que não quer calar” é: por que Oz. não pode figurar como sujeito nem como 
objeto seguido ao verbo? Mas isso não faz com que a gramática em (8) tenha os mesmos 
problemas já mencionados quanto a disfarçar um grau relativamente baixo de adequação 
descritiva através de regras que codificam em si as observações. As perguntas sem resposta 
não anulam a virtude de (8) sobre suas concorrentes quanto aos padrões serem capturados 
de modo compacto (sem excesso de regras que não passam de observações listadas em 
jargão técnico), sendo apenas a exceção no plano observacional tratada como exceção no 
plano descritivo. 

6. Não me refiro aqui a situações de foco contrastivo estreito sobre gu (e.g. Lola fez EU sorrir, 
enão ele), o que caracteriza uma outra sentença, com outra estrutura, outra prosódia, e um 
significado próprio, e que tem alto grau de aceitabilidade em praticamente todos dialetos, 
inclusive no que tomo por referência. 

7. Tipicamente em dialetos de Portugal, bem como na norma padrão da escrita formal 
brasileira, que, diferentemente das variedades faladas, prioriza a ênclise sobre a próclise 
(como neste livro, por exemplo). 
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e (10a) covariando; ou (9a) e (10b) covariando. De nada adianta declarar 
que os dados (9a), (10a) e (10b) são todos possíveis em português, se ao 
final estamos falando de extensões de gramáticas distintas em suas inten- 
sões. É importante descobrir os limites da variação e da invariância dentro 
de uma mesma gramática, e entre as várias gramáticas humanas possíveis. 
Mas, antes disso, precisamos isolar devidamente as gramáticas distintas, 
descrevê-las, para depois compará-las. 

Nas estruturas em (9) e (10), o objeto de fez é uma sentença subordina- 
da (reduzida de infinitivo), i.e. o que Lola fez foi algo que causou o sorriso 
do enunciador da sentença. Logo, me é o sujeito de sorrir*'*, não o objeto 
de fez. Não se pode, então, postular que a subsequência me”fez tenha sido 
gerada por (8d). Isso nos leva a hipotetizar a gramática em (11) que difere 
qualitativamente das outras de um modo substancial. 


(11) regras sintagmáticas: [a] S2SN'SV;  [b]SN5(D)'N; [c]Sv>v” a | 
s 
regra transformacional: [d] VN, > N/V/N E Ot 


As regras sintagmáticas (1 la) e (1 1b) dispensam comentários. (1 1c) é es- 
sencialmente o mesmo que (3c=6c), que determina que SV contém ime- 
diatamente um V seguido ou não de um objeto. Nos parênteses há chaves 
com uma coluna de opções do que pode ser objeto do V transitivo: SN 
ou $", Além das regras sintagmáticas, há também a regra transformacio- 
nal (11d), que se aplica ao produto das regras sintagmáticas, e reconhece 
qualquer subsequência VºN na estrutura global, não importando se o SN 


8. Do mesmo modo que, em Eu fiz Lola sorrir, temos que Lola é sujeito de sorrir, não objeto 
de fiz. 

9. Vemos, portanto, que a afirmação feita há pouco sobre os pronomes oblíquos era impre- 
cisa. Eles podem ser sujeitos, desde que numa sentença subordinada não finita (i.e, reduzi- 
da de infinitivo, gerúndio ou particípio). 

10. Esse incremento na regra é independentemente necessário para acomodar dados como 


Eu fiz Lola sorrir. 
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nucleado pelo N em questão é objeto do V que o precede ou sujeito de um 
V que o segue. A subsequência VºN é convertida em NºV se for encontra- 
da a condição especificada após o símbolo */, nesse caso, o N em questão 
deve pertencer ao conjunto dos ILs da categoria OsLíquo, um subtipo de 
pronome, que morfoprosodicamente funciona como um prefixo verbal, 
Como tal, seria de se esperar que me pudesse se prefixar a sorrir em (10a); 
mas a prefixação se dá com fez, evidenciando a existência de algo como 
(11d). Além disso, não havendo (11d), não seria possível satisfazer a na- 
tureza prefixal de me em (5b). A transformação aqui esboçada, ao mesmo 
tempo que mantém o conjunto de regras sintagmáticas intacto, simples e 
geral, também unifica o tratamento de casos como (10b) e (5b) sob um 
só mecanismo, capitalizando no que há de verdadeiramente idiossincrá- 
tico nos pronomes oblíquos, a despeito da diferença substancial entre as 
sentenças quanto ao pronome ser objeto do V anterior ou sujeito do V 
posterior. Esse procedimento não afeta outros elementos nominais, logo 
não sobregera. Omito aqui detalhes técnicos importantes, mas a proposta 
é que a transformação não afeta apenas a sequência de ILs, mas a estrutu- 


ra sintagmática como um todo, tal como exposto em (12) e (13) abaixo". 


(12a) (12b) 
3 E iris 
SN sv SN sv 
|" É 
N W SN regra (LId) N NV SN 
Maureen beijou | “8 Maureen me-beijou | 
N N 
ma Bd 


11. A notação [Nt ] indica que me foi retirado de sua posição original para se prefixar ao 
verbo anterior, deixando em seu lugar original um vestígio silencioso (t remete a trace, do 
inglês, que se traduz por vestígio). Veremos em $4,4.3 como esses vestígios indexados (aqui, 
o índice é x) formam dependências entre sintagmas distantes. 
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(13a) E) (13b) s 
a 


SN sv SN sv 
| A Ses | Sa 
N V s N NV s 
Lola fez Sa Lola me-fez DE ia 
pi Ki Ri si 
NV [tg V 
me- sorrir sorrir 


Sucessivos desafios com complexidade crescente forçam-nos a modifi- 
car nossas hipóteses sobre a forma da intensão da gramática gerativa, a fim 
de darmos conta do máximo possível de dados (positivos e negativos) de 
modo simples e unificado, com um mínimo de regras e premissas auxilia- 
res. Além de reconhecer idiossincrasias da língua específica sob investigação 
e hipotetizar sobre os mecanismos subjacentes, precisamos também iden- 
tificar aquilo que é próprio da Faculdade da Linguagem como um todo, 
que se manifesta em todas as línguas ainda que com algumas variações su- 
perficiais, articulando assim a investigação da gramática de uma língua no 
contexto de uma teoria geral da gramática, que compreenderia ferramentas 
teórico-analíticas gerais como a noção de regra sintagmática acima, entre 
outras. Isso possibilita comparações efetivas e produtivas entre línguas, de 
modo que o estudo de uma ilumine o estudo de outra. Do contrário, lin- 
guistas estariam mais para colecionadores de borboletas” do que para 'zoó- 
logos entomólogos” (cf. Chomsky 1979: 57). Em uma de suas obras clássicas 
que delinearam as bases da GGT, Chomsky (1965: 4-6) afirma: 


A gramática de uma língua pretende ser uma descrição da competência in- 
trinseca do falante-ouvinte ideal. Se, além disso, a gramática for perfeitamente 
explícita [...), podemos [...] chamá-la de gramática gerativa. Uma gramática 
plenamente adequada deve atribuir a cada uma de uma gama infinita de sen- 
tenças uma descrição estrutural indicando como a sentença é compreendida 
pelo falante-ouvinte ideal. Este é o problema tradicional da linguística descri- 
tiva, e as gramáticas tradicionais oferecem uma boa dose de informações sobre 
as estruturas das sentenças. Contudo, [....] [elas] são deficitárias na medida em 
que não capturam muitas das regularidades básicas da língua de que tratam. 
Isso é particularmente evidente no plano sintático, em que nenhuma gramática 
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tradicional ou estruturalista vai além da classificação de exemplos particulares, 
não chegando ao estágio da formulação de regras gerativas com alcance sig; 
cativo. [...] [Uma propriedade essencial da linguagem consiste em seus meios 
para expressar um número indefinido de pensamentos e para reagir apropria- 
damente a uma gama indefinida de novas situações [...]. A gramática de uma 
lingua particular deve, então, estar integrada a uma gramática universal que dê 
conta do aspecto criativo do uso da linguagem e que codifique as regularidades 
mais básicas, as quais, por serem universais, são omitidas da gramática especifi- 
ca. [...] Apenas quando integrada a uma gramática universal é que a gramática 
de uma língua dá conta plenamente da competência do falante-ouvinte. 


As gramáticas consideradas nesta seção foram todas construídas a partir 
do arcabouço teórico-analítico chomskyano (da segunda metade da déca- 
da de 1960). Isso não exclui a possibilidade de executarmos essencialmente 
o mesmo procedimento explorando álgebras formais distintas, oriundas 
de outros quadros teóricos. Chomsky (1986a: 4-5) enfatiza que a gramática 
gerativa não é propriamente uma teoria defendida por uns e não outros. É 
um tópico passível de investigação científica, tal como a estrutura química 
da matéria, que alguns se dedicam a estudar, podendo haver diferentes teo- 
rias concorrentes nesse campo. Bem antes, Chomsky (1965: 8) já deixava 
claro que “o que [ele] entend[e] por gramática gerativa é simplesmente 
um sistema de regras que, de algum modo explícito e bem definido, atribui 
descrições estruturais a sentenças”. Adiante (op. cit.: 28), 0 autor acrescenta 
que “o estudo dos universais linguísticos é o estudo das propriedades in- 
trínsecas a qualquer gramática gerativa de uma língua natural”, Em suma 
(cf. op. cit. cap 1, $6, para uma discussão detalhada), o objetivo último da 
teoria gramatical é descobrir, dentre inúmeras teorias da gramática gera- 
tiva formuláveis, qual delas é a melhor em termos empíricos e conceituais, 
i.e. a mais adequada em todos os níveis de adequação. Não necessariamente 
esta “melhor teoria” seria formulada em termos das ferramentas de análise 
formal que Chomsky propôs (e.g. transformações, estrutura profunda, la- 
cunas, vestígios, etc.). 

É por esse motivo que eu — e não estou sozinho nisso — faço questão de 
chamar o paradigma chomskyano de Gramática Gerativo-Transformacional, 


128 


e não apenas Gramática Gerativa”. De acordo com as bases teóricas estabe- 
lecidas pelo próprio Chomsky (1965: 8-9), numa das obras seminais de seu 
paradigma, outras propostas de formalização algébrica para as gramáticas 
das línguas naturais também podem, em princípio, se configurar como 'gra- 
máticas gerativas' possíveis, a serem avaliadas quanto à satisfação ou não dos 
requisitos de cada nível de adequação. O que a vertente chomskyana tem 
de mais característico é a aposta na ideia de que a gramática gerativa geral 
tem um componente transformacional, com mecanismos que correlacionam 
estruturas distintas numa mesma sentença. Além disso, há, no paradigma 
chomskyano, um comprometimento mais explícito com a dimensão psico- 
lógica da gramática e o consequente enfrentamento de questões aquisicio- 
nais, neurofisiológicas e evolutivas, que em outros paradigmas são deixadas 
de lado em maior ou menor grau. 


63.2. INFINITUDE, RECURSIVIDADE E CRIATIVIDADE 


É consensual a ideia de que a gramática permite a formação de infinitas 
expressões através de meios finitos, que remonta à visão de W. Humbolt. 
Não se pode demonstrar isso listando as infinitas expressões da extensão da 
gramática, o que nos demandaria espaço e tempo infinitos. No entanto, po- 
de-se inferir isso indiretamente, via lógica dedutiva. Analogamente, o mes- 
mo ocorre ao se afirmar que há infinitos números. Todos sabemos contar 


“até o infinito! Começamos por “1, 2, 3. e terminamos quando atingimos 


o número que nos interessa (e.g. o número de caracteres impressos neste 


12. Lamentavelmente, é frequente teóricos da gramática novatos ou experientes referi- 
rem-se aos supostos modelo transformacional e modelo não transformacional do quadro 
teórico chomskyano, sendo o não transformacional o mais recente, que teria superado o 
primeiro. Trata-se de um erro grave. Parte do equívoco deve-se à premissa falsa de que 
transformação e derivação seriam sinônimos (ou que um pressupõe o outro), somado ao 
fato de que o esquema X-Barra — concebido como uma alternativa superior às regras sin- 
tagmáticas desta seção e da próxima — gera estrutura sintagmática sem haver derivações. A 
noção de transformação continua exercendo um papel crucial, como sempre, embora os 
detalhes técnicos em torno dela sejam sempre objeto de debate. 
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livro), ou quando cansamos, ou quando chegamos a um número cujo nome 
não sabemos, etc. Apesar do término de uma contagem particular, sabemos 
que há infinitos números para além daquele que marcou o fim daquela con- 
tagem. Não sabemos isso porque teríamos todos os infinitos números pré- 
-listados na mente, pois nossa memória, embora enorme, é finita. Sabemos 
da infinitude dos números porque sabemos aplicar a operação “mais um” 
(tecnicamente, a função de sucessor) ao maior número que obtivemos até 
então, para então obtermos um número ainda maior, ao qual, por sua 
vez, pode-se aplicar recursivamente a operação “mais um” para obter- 
mos O próximo número, ad infinitum. A definição exata de recursividade 
em termos matemáticos, embora importante, não é necessária para nossos 
propósitos imediatos", Aqui, é suficiente entender que uma estrutura é re- 
cursiva se ela é formada pela aplicação de uma dada operação ao produto 
de outra aplicação daquela mesma operação (ou, alternativamente, se ela 
contém em si uma subestrutura com as mesmas propriedades relevantes do 
todo). Vejamos em (14) como isso se verifica empiricamente na sintaxe da 
linguagem natural. 


(14) [S Anita mentiu] 

(14b) [ Karen provou [S que Anita mentiu]) 

(14c) [º Janice disse [* que Karen provou [º que Anita mentiu]]] 

(14d) [* Cassie sabe [º que Janice disse [* que Karen provou [* que Anita mentiu]]]) 


Em (14b), a sentença simples (14a) é encaixada dentro de uma sentença 
maior, exercendo ali a função de objeto direto. Em (14c), aquela mesma 
sentença maior é o objeto direto de outra sentença maior ainda. Em (14d), 
há uma sentença 'grandona, que traz em seu objeto direto todas as ante- 
riores. O mesmíssimo mecanismo gramatical de encaixe de uma sentença 
na posição de objeto direto de outra (que pressupõe a regra SV5V'S, ou 


13. Recomendo Partee et al. (1993: 179-183) ao iniciante e Tomalin (2007) e van der Hulst 
(20104) ao iniciado. 
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equivalente)! permite que (14d) seja encaixada numa sentença ainda mais 
'grandona; que por sua vez também é encaixável em uma sentença 'gigante, 
igualmente encaixável em outra ainda mais gigantesca, etc. Obviamente, 
limites da ordem do desempenho nos impedem de usar sentenças 'grandes 
demais” na comunicação cotidiana (faltam-nos memória, atenção e fóle- 
go)”, Mas nossa competência admite que sentenças se encaixem em outras 
sentenças ilimitadamente, através da aplicação recursiva dos mesmos meios 
combinatórios que geram (14b), em que há tão somente uma sentença “pe- 
quenina” dentro de outra 'maiorzinha! A isso chamamos de recursividade 
sentencial, Há outros tipos de recursividade, como ilustrado em (15), em 
que temos SNs dentro de SNs, e SPs dentro de SPs, intercalando-se. 


(15a) Eu vi [* a professora] 

(15b) Eu vi [** a amiga [*” d[S* a professora]]] 

(15c) Eu vi [a prima [9 d[S a amiga [” d[“ a professora]]]]] 

(15d) Eu vi [* a mãe [*º d[S“ a prima [S” d[S* a amiga [*” d[S* a professora]]])]]] 


Há vários pontos sobre recursividade que merecem discussão. Primeira- 
mente, uma sentença pode se encaixar em outra ocupando várias posições 
que não apenas a de objeto direto, e uma sentença 'grandona como (16b) 
pode conter em si múltiplos tipos de encaixe. 


(16a) [* [** a notícia] preocupa os acionistas [** inconsequentes] [*” por motivos 
óbvios]]. 


14. Há múltiplas análises possíveis. Bem simplificadamente, na visão típica da GGT, a sen- 
tença encaixada não seria S, mas sim S': uma “sentença estendida! formada pela combina- 
ção de S com que através da regra S'9que'S. O encaixe de S' se daria pela regra SVDV'S". 
Alternativamente, pode-se propor uma regra como SN que'S, cujo efeito não é encaixar 
S diretamente como complemento de V, mas sim a criação de um SN, que se encaixaria em 
outra sentença do mesmo modo como qualquer outro SN ordinário. 

15. Como vimos em $2.2, o grau de dificuldade de processamento de sentenças complexas 
em tempo real depende não só do número de encaixamentos recursivos, mas também do 
tipo deles. 
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(16b) [5 [5 que a empresa demitiu 70% dos funcionários] preocupa os acionistas 
[ que investiram nela todas as suas economias] [* porque o risco de falência 
é evidente] ]. 


Diferentemente da recursividade de SNs dentro de SNs (cf. (15)), que 
desde a incepção da GGT eram reconhecidas como consequência natural 
das regras sintagmáticas (cf. Chomsky 1955a: 171-172), vale ressaltar que a 
recursividade sentencial não era concebida como diretamente decorren- 
te das regras sintagmáticas (e.g. SV2V'S) durante a primeira década da 
GGT (cf. Chomsky 1955a: 516-519). Um dado como (14d) era tido como 
derivado a partir de quatro sentenças básicas independentes, aproximada- 
mente como: (i) Anita mentiu; (ii) Karen provou algo; (iii) Janice disse 
algo; (iv) Cassie sabe algo. Os encaixes de sentenças umas nas outras não 
se dariam por regras sintagmáticas, mas por regras transformacionais do 
subtipo das transformações generalizadas, que tomam sentenças indepen- 
dentes e as combinam conforme certas características delas, modificando 
suas estruturas originais. Grosso modo, (i) substitui algo em (ii), que substi- 
tui algo em (iii), que substitui algo em (iv), com ajustes adicionais relativos 
à inserção de que. 

Chomsky (1965: 132-137) abandona a noção de transformações genera- 
lizadas, por considerar que suas formulações eram demasiado arbitrárias e 
complexas. Os mesmos resultados poderiam ser obtidos em termos pura- 
mente sintagmáticos (acrescendo-se regras como SV>V'S), feitos os de- 
vidos ajustes no subcomponente transformacional, composto de transfor- 
mações singulares. Estas já eram assumidas nas versões anteriores da GGT, e 
cuja natureza consiste em identificar, na estrutura de uma sentença básica 
gerada pelas regras sintagmáticas, um ou mais elementos, definido(s) pela 
posição estrutural que ocupa(m), afetando-o(s) de modo a mapear uma 
estrutura sintagmática em outra estrutura sintagmática correspondente 
(tal que ambas tomadas in tandem, compõem a estrutura transformacio- 
nal da sentença). Assim concebida, essa estrutura inicial unificada, forma- 
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da somente por regras sintagmáticas (capazes de codificar recursividade 
sentencial do tipo (14d) já na base), foi denominada Estrutura Profunda 
(a partir da qual todo o significado seria extraído)'*. Sobre ela as transfor- 
mações singulares seriam aplicadas, resultando na Estrutura Superficial (a 
partir da qual toda a estrutura morfofonológica seria extraída). Gradati- 
vamente, essa concepção geral da “arquitetura da gramática” foi bastante 
reelaborada nos anos subsequentes, até as versões mais recentes da GGT, 
nas quais há um retorno parcial a algumas concepções de derivação, re- 
gras sintagmáticas e transformacionais oriundas da primeira década da 
GGT, numa versão mais 'enxuta) feitos diversos ajustes para acomodar as 
generalizações empíricas acumuladas ao longo do tempo (cf. Chomsky 
1955a, 1965, 1970b, 1981a, 1986a, 1986b, 1995a; Frank 2002; Lasnik 2015). 
Elaboro sobre isso adiante, cf. $4.3. 

Para Chomsky (1955a: cap VII; 1957: 41), orações subordinadas reduzidas 
como (17) eram geradas na base, via regras sintagmáticas, gerando SNs e 
SAs complexos trazendo em si um “SV nominalizado” (não S). Isso envol- 
veria, adiante, transformações singulares reorganizadoras dos morfemas 
relevantes de infinitivo, gerúndio e particípio. 


(17a) Eu vi você acordar. (17b) Eu vi você acordando. (17c) Eu vi você acordada. 


Entretanto, nessas mesmas obras (Chomsky 1955a: cap X; 1957: 72, 113), 
tais construções são reanalisadas em termos de transformações de no- 
minalização aplicadas a sentenças independentes que se encaixam na 
sentença principal via transformações generalizadas. 


16. Cf. Chomsky (1970b), inter alia, para uma revisão dessa assunção, e a admissão de que 
parte do significado estaria codificado na Estrutura Superficial; bem como trabalhos sub- 
sequentes em que o nível ulterior de Forma Lógica é postulado, culminando com uma das 
hipóteses centrais do Programa Minimalista, segundo a qual não há Estrutura Profunda 
nem Estrutura Superficial, e todo o significado é codificado em Forma Lógica. 
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Chomsky (1965) propõe que subordinadas de todos os tipos envol- 
vam uma unidade do tipo S gerada na base, via regras sintagmáticas 
(e.g. SV2V'S, ou equivalente). Na década de 1980, a partir de debates 
entre Edwin Williams e Timothy Stowell, ressurge a ideia de que dados 
como (17) envolvem unidades menores que S geradas na base. Nascia 
então o conceito de minioração, que seria algo como uma sentença des- 
tituída (totalmente ou parcialmente) de certos elementos gramaticais 
característicos de S, mas com uma estrutura completa de 'predicador e 
argumentos" (cf. discussão sobre papéis temáticos em $4.4.2 adiante). 
Remeto o leitor a Mioto & Foltran (2007: 5-7) para uma breve e infor- 
mativa apresentação do tema. Não faltam, no entanto, propostas antigas 
e recentes contrárias à ideia de minioração, ou restringindo as miniora- 
ções a subtipos específicos de orações reduzidas. 

Nada nas primeiras versões da GGT proibia que estruturas com re- 
cursividade de SNs dentro de SNs do tipo exemplificado em (15d) fos- 
sem geradas já na base, via regras sintagmáticas (e.g. SN5(D)"N"(SP) 
e SP5P"SN). Isso não impedia que eventualmente instâncias de 'SN 
dentro de SNº pudessem ser geradas por transformações generalizadas, 
como em casos de coordenação, conforme exemplificado em (18b), ge- 
rado a partir de (18a)”. 


(184) S, = [º [“ civis | [* morreram]) S, = [º [* militares | [” morreram]] 


(18b)S, = [º [** [civis ] e [“ militares ]] [*” morreram] 


17.A transformação generalizada de coordenação (Chomsky 1955a: 224-227,556-561; 1957: 
36) era formulada de modo suficientemente geral para dar conta da coordenação de sin- 
tagmas de qualquer tipo (SN, SV, SA, SP, S). Coordenações de sintagmas de tipos diferen- 
tes (e.g. vestido [[** preto] e |” com bolinhas]|) representavam um problema para aquele 
modelo, e passaram a ser mais bem acomodadas em análises mais recentes (e.g. Camacho 
2003; Zhang 2010), baseadas na noção de que a conjunção coordenativa é um elemento 
com identidade categorial neutra que deve se combinar com sintagmas que compartilhem 
características relevantes, o que não implica identidade categorial plena. É importante re- 
conhecer que esse avanço foi alavancado por críticas e contrapropostas muito pertinentes 
oriundas de fora da GGT, dentre as quais destaco Sag et al. (1985). 


134 


Com o abandono das transformações generalizadas, estruturas como (18b) 
passaram a ser analisadas como geradas na base, diretamente via re- 
gras sintagmáticas". 

Dos muitos outros subfenômenos da recursividade de unidades sintá- 
ticas, menciono finalmente a adjunção, que, desde as origens da GGT até 
hoje, tem sido tradicionalmente analisada (pondo de lado algumas aborda- 
gens heterodoxas minoritárias) em termos de estruturas com uma unidade 
sintática de um dado tipo (digamos, SN) imediatamente contida em outra 
unidade do mesmo tipo”, não havendo limites para quantas vezes esse 'em- 
pilhamento” de sintagmas do mesmo tipo poderia ocorrer. Considere os 
exemplos abaixo. 


(19a) Aline vendeu um carro. 
(19b) Aline vendeu um carro conversível. 
(19c) Aline vendeu um carro conversível importado. 


(19d) Aline vendeu um carro conversível importado azul. 


Há fatos importantes a se observar em paradigmas como esse. Qualquer 
que seja o núcleo do sintagma, adjuntos nunca são obrigatórios, o que cor- 
robora a ideia de que adjuntos não seriam previstos (sequer como acessó- 
rios, entre parênteses) na regra básica do sintagma. O fato de poder haver 
ilimitados adjuntos num mesmo sintagma sugere que cada adjunto forma 
com o sintagma ao qual se adjunge um bloco que se configura num sintag- 


18. A rigor, nunca houve um consenso total quanto à estrutura exata das coordenações. 
Além de análises assumindo a geração de (18b) na base, há também aquelas segundo 
as quais o subcomponente sintagmático sempre coordena sentenças inteiras, havendo 
posteriormente uma transformação de elipse que “silencia” as partes homófonas, e.g. 
[IS civis) £merresanah] e [* [* militares | [ morreram]]). 

19. Esse recurso técnico que envolve recursividade imediata leva o nome de “adjunção 
chomskyana) pois foi o próprio Chomsky (1955a: cap IX) quem primeiro o definiu (em 
termos transformacionais, em conjunção com os conceitos de substituição, deformação 
e permutação). 
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ma do mesmo tipo do “hospedeiro” da adjunção, sendo essa unidade capaz 
de hospedar mais um adjunto, indefinidamente. Assim, adjuntos nominais 
envolveriam algo como a regra SN5SN'SA, por exemplo, prevendo a es- 
trutura em (20) para o dado (19d)?. 


(20) SN 


Ed 
SN SA 
Ei: 
SN SA A 
O | azul 
SN SA A 
2 | importado 
D N A 


um carro conversível 


Eis outro fato sugestivo de que adjunção envolve estruturas como (20). O 


SN um animal pequeno grande descreve, por exemplo, um inseto gigante, 
mas não um filhote de elefante, que pode ser descrito pelo SN um animal 
grande pequeno. Em ambos os casos, o animal em questão é “grande e pe- 
queno”, mas há uma diferença quanto ao que se atribui as propriedades 


20. A título de comparação, considere primeiro (i) e (ii), atentando para os complementos 
verbais e nominais, quanto à sua obrigatoriedade ou opcionalidade, e quanto a ser ou não 
possível haver mais de um deles. 

(ia) O vândalo destruiu [* a praça]; (ib) “O vândalo destruiu; (ic) *O vândalo destruiu [** 
apraça] [* a casa]; (id) O vândalo destruiu [* [Sa praça] e [* a casa]). 

(ia) Eu vi a destruição [” da praça); (iib) Eu vi a destruição; (ic) *Eu vi a destruição [ da 
praça] [*” da casa); (id) Eu vi a destruição [* [*” da praça] e [* da casa)). 

A maioria dos dados é trivial. Algo como (i-b) é possível somente num contexto que Ii- 
cencie a elipse do objeto, previamente mencionado, mas não num enunciado dito “à quei- 
ma-roupa! A aceitabilidade de (i-d) e (ii-d) só evidencia que (i-c) e (ii-c) são agramaticais 
devido a “não caber mais de um complemento” na estrutura (cf. Kayne 1994: 11-12). A coor- 
denação é um recurso que toma dois (ou mais) sintagmas (tipicamente da mesma catego- 
ria) e forma um único sintagma que os contém, e que pode ser o “complemento único' (cf, 
n. 17). (ii-b) é o único dado que foge ao padrão geral. Por motivos ainda não totalmente 
claros, complementos nominais ou adjetivais não são tão obrigatórios quanto os verbais, 
que, por sua vez, não o são tanto quanto os preposicionais. 
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de pequenez e grandeza. Em um animal pequeno grande, grande expressa 
um atributo de um membro do conjunto dos animais pequenos. Em um 
animal grande pequeno, pequeno expressa um atributo de um membro 
do conjunto dos animais grandes. Isso sugere fortemente as estruturas em 
(21), em que cada SA tem escopo sobre a estrutura com a qual ele está 
combinado diretamente, no mesmo nível. Há um SA mais externo e um 
mais interno, resultando em interpretações distintas”: “grande entre os pe- 
quenos'e pequeno entre os grandes, Se, para esses dados, assumirmos uma 
estrutura mais “achatada” e não recursiva, como (22a) ou (22b), é mais difi- 
cil acomodar esse fato acerca da interpretação de adjuntos”. 


(21a) SN (21b) SN 
2. Foo 
SN SA SN SA 
Piá 2 
SN SA A SN SA A 
1. | grande 4. | pequeno 
D N A D N A 
um animal pequeno um animal grande 
(22a) SN (22b) SN 
SN SA SA SA SA 
2 Sa 1] | I | 
p ad DNA A 


21. No domínio verbal, verifica-se algo semelhante. Considere os exemplos em (i). Em 
ambos, [duas vezes) e [três vezes] são adjuntos do SV cujo 'cerne' é [defendeu pênalti). 
Em (i-a), [três vezes] se adjunge ao SV maior e [duas vezes] ao menor. Em (i-b), ocorre 
o contrário. Semanticamente, temos em (i-a) que, por três vezes, Taffarel defendeu dois 
pênaltis num jogo; e em (i-b) que, por duas vezes, ele defendeu três pênaltis num jogo. 
(ia) Taffarel [9 [* [“ defendeu pênalti] [duas vezes]) [três vezes)). 

(i-b) Taffarel [*” [* [ defendeu pênalti) [três vezes]] [duas vezes]). 

22. Essa não é a única abordagem possível para o tema em pauta, nem é livre de questões; 
mas os dados em (21) são mais uma evidência favorável à hipótese em discussão, corrobo- 
rada independentemente por outros fatos. 
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Analogamente, adjuntos verbais envolveriam uma regra como SV> 
SV"SAdy (e variantes, e.g. SV>SV'SP), conforme exemplificado em (23)”. 


(23a) Senri Kawaguchi tocou bateria. 

(23b) Senri Kawaguchi tocou bateria [neste teatro). 

(23c) Senri Kawaguchi tocou bateria [neste teatro] [maravilhosamente]. 

(23d) Senri Kawaguchi tocou bateria [neste teatro) [maravilhosamente] [dez vezes]. 


Assim, os muitos tipos de recursividade sintática podem ser divididos 
em dois grupos principais: a recursividade imediata (cf. (24)) e a não ime- 
diata (cf. (25)): 


(24) 45P'a (25) [a] «By; [b] ye; [e] eG'a 


Além disso, é relevante notar que recursividade imediata e não imediata 
também existem na morfologia, conforme se pode atestar em (26) e (27), 
respectivamente. 


(26) [elit]ismo > antil [elitlismo) > anti[antil [elit]Jismo]] > 
anti[anti[anti[[elitjismo]]] 
(27) [Norma] > [*["form]al] > [“[*[“form]al]izar] > [*[“["[“form]alJizá] vel] 


. (i-ii) evidenciam a adequação de estruturas com recursividade de SV para casos de 
múltiplos adjuntos verbais. 
(i) Senri Kawaguchi tocou bateria neste teatro maravilhosamente; (ii) Akira Jimbo tam- 
bém, dez vezes. 
Em (ii) teríamos o acréscimo de um adjunto a uma cópia de um SV de (i) submetido a 
elipse. Tal SV pode ser tocou bateria, tocou bateria neste teatro ou tocou bateria neste teatro 
maravilhosamente, contemplando as três interpretações disponíveis, pois há em (i) três SVs 
retomáveis por (ii), um sendo uma subparte própria do outro. 
24. Em (27), embora não haja um mesmo morfema sendo aplicado mais de uma vez na 
derivação da palavra maior, tem-se um caso de recursividade não imediata da formação de 
adjetivo a partir de um não adjetivo, com as sufixações de -a] e -vel, na formação da segun- 
da e da quarta palavras, respectivamente. 
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Assim como a evolução das espécies é um fato inegável que diferentes 


versões da teoria da evolução abordam diferentemente, a recursividade e a 
infinitude na morfossintaxe da linguagem humana é um fato inegável para 
o qual qualquer teoria da gramática deve propor um tratamento formal, 
Deve-se reconhecer a recursividade e a infinitude não apenas como pro- 
priedades da língua enquanto abstração; mas como parte da nossa compe- 
tência gramatical, codificada em nosso aparato neurofisiológico”. É graças 
a isso que somos psicologicamente aptos a “veicular infinitas mensagens 
a partir de meios finitos; e podemos dizer o que jamais se disse, e com- 
preender o que jamais nos disseram antes. Ainda que essa infinitude de 
pensamentos possa ter raízes fora da própria gramática, o fato é que, para 
produzir e compreender as infinitas expressões desses infinitos pensamen- 
tos, é preciso que a intensão da Língua-I tenha meios de codificar esse “pulo 
do gato. Logo, uma teoria da Gramática Gerativa se faz necessária, caso 
contrário não se pode prever tal infinitude, que está na base do “aspecto 
criativo da linguagem humana; que faz dela um objeto irredutível a uma 
lista de expressões ou mesmo de moldes estruturais (cf. Chomsky 1968: 
11-12). Tal “criatividade” não é uma extrapolação do “código” para além de 
seus limites. Quando “criamos” uma sentença nova e inovadora em sua for- 
ma e conteúdo, não estamos inventando nada que já não estivesse previs- 
to pelo sistema. É legítimo, no entanto, chamarmos isso de “criatividade”, 
bem como é legítimo falar que um enxadrista é criativo e surpreende seus 
adversários com jogadas inesperadas e “originais, mas que estavam todas 
previstas pelas regras do jogo. 

Ao incorporarmos a recursividade em nossa teoria, qualquer erro de 
formulação pode ser fatal em sobregerar infinitamente ou subgerar infi- 
nitamente. Isso é bom, pois nos permite detectar facilmente nossos erros e 
corrigi-los. Como já dito, é inevitável na investigação científica a constante 


25. Remeto o leitor a Postal (2009) e Pullum & Scholz (2010) para surpreendentes, intrin- 
cadas e ousadas argumentações de que o truísmo ora exposto seria uma falácia absurda. 
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sensação frustrante de que 'a conta nunca fecha”, pois sempre há infinitos 
dados (positivos e negativos) cuja geração ou não geração não prevíamos. 
Temos sempre que avaliar nossos infinitos sucessos e infinitos fracassos, e 
remodelar nossa teoria”. 


53.3. SENTENÇA E DESCRIÇÃO ESTRUTURAL, CAPACIDADES 
GERATIVAS FRACA & FORTE 


Partamos das definições de Língua e de Gramática em (28), adap- 
tadas de Chomsky (1955a: 71; 1957: 13-15; 1965: 30-37), que serão reto- 
madas e reelaboradas adiante em conformidade com a definição de 
Língua-l (cf. Chomsky 1986a) apresentada em $2.7. 


(28) Toda língua natural é um conjunto (infinito) de sentenças (i.e. sequências” 
de ILs, cada uma com comprimento finito) legitimamente disponíveis para 
o falante usar. Dada uma língua específica L, (um)a gramática G de L é um 
sistema finito de regras e princípios que, se aplicados, têm o poder de gerar 
todas e apenas as sentenças de L e suas descrições estruturais corresponden- 
tes, prevendo os significados a elas associados e as características essenciais 
de suas pronúncias. 


Sob essa ótica, consideremos o dado em (29), classificável como uma “sen- 
tença ambígua. Sua aceitabilidade plena sugere tratar-se de “uma sentença 
da língua! Sua “ambiguidade” deve-se ao fato de ela poder veicular o mesmo 
significado de (30a) ou o mesmo de (30b), que veiculam, cada uma, signi- 
ficados unívocos e distintos (sendo, pois, sentenças não ambíguas). 


26. Mensurar o grau de sucesso de uma teoria não é trivial. Não se trata apenas de qual é 
o percentual dos fatos empíricos que se explica. Trata-se também do quanto de cobertura 
empírica se tem relativamente à complexidade do sistema postulado para se construir a 
explicação. Mais que isso, às vezes “bater na trave mil vezes em mil pode ser melhor do que 
“fazer dez gols em mil e chutar para fora 990 vezes, por assim dizer. A esse respeito, remeto 
o leitor a Epstein & Seely (2006: 1-4) para uma discussão iluminadora. 

27. Traduzo string por sequência! A rigor, há uma diferença entre string e sequence, que às 
vezes é relevante. Chomsky (1955a: 106) nota ser possível unificar os conceitos, mas não de 
modo trivial. 
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(29) Aline vendeu o carro rápido. 
(30a) Aline vendeu o carro rapidamente. 
(30b) Aline vendeu o carro que anda rápido. 


Nessa visão, uma coisa seria a sentença (uma sequência gramatical 
de ILs), outra seria a sua estrutura gramatical. A sentença em (29) teria 
duas estruturas sintáticas associadas a ela (aproximadamente como (31a) 
e (31b)), correspondendo às duas interpretações de (29), parafrascáveis 
como (30a) e (30b) respectivamente. Isso exemplifica o que Chomsky 
(1955a: 177, 215-216, 271, 297-298, 490, 509; 1956: 118; 1957: 86) chamou de 
homonímia de construção: 


(3a) (1b) s 
s E da 
A SN sv 
SN sv | Eos 
| A N vV SN 
N sv SA Aline vendeu 2H. 
Aline MM | SN SA 
Vo SNA /N I 
vendeu /, rápido DN A 
DN o carro rápido 
o carro 


Para fins práticos, adoto a visão (não trivial) de que (31a) e (31b) são ar- 
ranjos sintáticos distintos dos mesmos ILs*. Em ambos os casos, teríamos a 
mesma sequência de ILs, mas em arranjos que diferem num nível de aná- 
lise mais abstrato, no qual se reconhecem partes e subpartes da sequência, 
agrupadas diferentemente. Só assim se pode capturar a ambiguidade de 


28. A questão que se coloca é se ambos os casos trariam em si instâncias do mesmo vocá- 
bulo rápido, que, em (30b-31b), designa 'um atributo do carro; e, em (30a-31a), designa 'o 
modo como a venda ocorreu? É mais comum conceber aí dois ILs distintos, um A(djetivo) 
e um Adv(érbio), o segundo sendo uma versão reduzida de rapidamente. A opção que 
adotei, por razões expositivas, embora não trivial, se baseia numa proposta concreta de 
Chomsky (1970a, 1981a), adotada e elaborada por uns e rejeitada por outros. 
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(29), que na superfície (excetuando-se a prosódia) se reduz a Aline'ven- 
deu'o'carro'rápido, mas que, no plano lógico, corresponderia ao par de 
estruturas em (31). 

No jargão das versões iniciais da GGT (também usado em teorias não 
transformacionais), dizia-se que (31a) e (31b) seriam duas descrições estru- 
turais possíveis para a mesma sentença (29). Já (30a) e (30b) teriam, cada 
uma, apenas uma descrição estrutural, simplificadamente explicitadas em 
(32a) e (32b), respectivamente. 


(32a) (32b) s 
s Pe cado 
do SN sv 
SN sv | 2a 
| ES NOV SN 
No SV SAdy Aline vendeu 
Aline | SN s 
V SN Adv /N as 
vendeu /», rapidamente D N SN sv 
DN o carro | 4H 
o carro NSVv SA 
que || 
V A 
anda rápido 


Nessa perspectiva, diz-se que uma teoria gramatical dá conta plenamen- 
te do dado em (29) se ela gera fracamente a sequência de ILs em (29) e 
também gera fortemente as descrições estruturais em (3a) e (31b), asso- 
ciando-as a esta mesma sentença. Logo, geração fraca e geração forte são 
capacidades distintas de uma gramática (cf. Chomsky 1963). Ambas as gra- 
máticas (33) e (34) geram fracamente (29). Mas nenhuma delas captura a 
sua ambiguidade, pois (33) gera fortemente apenas (31a), e (34) gera for- 
temente apenas (31b). 


(33) [a] S2SN'SV; [b] SND(DJ'N; [e] SV2V(SN); [d] SADA; 
[e] SV>SV'SA 

(34) [a] SPSN'SV; [b] SNH(DY'N; [e] SV2V(SN); [d] SADA; 
[e] SN>SN'SA 
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A diferença em capacidade gerativa forte entre (33) e (34) reside apenas 
em suas regras de adjunção. (33e) estabelece que um SV pode conter em 
si um SV menor, seguido de um SA com função de adjunto verbal, expres- 
sando uma circunstância da ação verbal. (34e) estabelece que um SN pode 
conter em si um SN menor, seguido de um SA com função de adjunto 
nominal, expressando um atributo da entidade expressa pelo SN menor. 

Uma gramática apenas com as três primeiras regras compartilhadas por 
(33) e (34) não tem sequer capacidade gerativa fraca para gerar (29), por 
não ter meios de gerar estruturas contendo SAs. Aliás, mesmo que tenha 
também a quarta das regras acima, uma gramática que não tenha nenhu- 
ma regra como (33e) ou (34e) não tem como integrar um SA à estrutura 
global. Uma gramática mais adequada que (33) e (34) seria uma que tivesse 
ambas as regras (33e) e (34e), ou uma outra regra mais abrangente que fi- 
zesse o papel dessas duas, sem sobregerar nenhuma estrutura de adjunção 
não própria da língua, nem subgerar nenhuma que lhe seja própria”. Para 
os nossos propósitos imediatos, adotemos a gramática em (35): 


(35) [a] S2SN'SV; [b] SN>(DY'N; [e] SV>V'(SN); 
[d] SASA; [e] SV2SV'SA; [f] SN5SN'SA 


Assim, é dado um tratamento à ambiguidade de (29) em termos de uma 
gramática que gera fracamente a sentença (29) e gera fortemente as des- 
crições estruturais (31a) e (31b), ambas associadas a (29). Como ressalta 
Chomsky (1957: 86-87), homonímias de construção como a descrita aci- 
ma constituem um de muitos argumentos contra a visão simplista de que 
sentenças seriam meras sequências de ILs sem agrupamentos em blocos 


29. Pode-se propor, por exemplo, a regra SX)SX'SY, em que X e Y são quaisquer classes 
de palavra! Isso dá a várias adjunções um tratamento unificado, o que seria bom ou ruim, 
a depender do quanto todas elas exibem propriedades equivalentes. Uma fórmula tão geral 
corre o risco de sobregerar, pois não restringe o que X e Y possam ser. Ou seja, qualquer sin- 
tagma poderia se adjungir a qualquer outro, a menos que a gramática (geral ou particular) 
também tenha restrições que filtrem algumas possibilidades. Volto a esse ponto em $3.6. 
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menores ontem de iene maiores. Sem estrutura ii tem-se a 
dente a (31b) talvez possa ser papa devido a carro e rápido estarem 
adjacentes. Frente a exemplos um pouco mais complexos, vemos que nem 
isso se sustenta”; mas, mesmo assumindo que sim, o caráter problemático 
de uma sintaxe puramente linear se mostra insolúvel em relação à inter- 
pretação (31a), que exige, no mínimo, uma estrutura como Aline'SV"rápi- 
do, na qual vendeu"o“carro tem seu significado interno calculado à parte e 
compilado numa unidade do tipo SV, que então se combina a rápido. 

Em suma, a capacidade gerativa forte de gramáticas puramente lineares 
é zero, ainda que elas pudessem, no limite, gerar fracamente as sequências 
desejadas. Isso não apenas impossibilita o tratamento de fatos 'semânticos), 
como também deixa escapar certas regularidades prosódicas associadas”. 
Por exemplo, como mostro em Guimarães (1998: 134, 193-196), há um cor- 
relato métrico-rítmico às duas interpretações do SN o professor de balé 
tusso. Na leitura em que o balé é russo (associada à estrutura em (36a)), 
tipicamente se obtém “retração de acento; ocasionando a pronúncia 'BÁle- 
-RÚsso” Na leitura em que o professor é russo (associada à estrutura em 
(36b)), tal retração não se verifica. Detalhes técnicos à parte, é fácil notar, 
pelos diagramas, que balé e russo estão estruturalmente mais próximos em 


30. Muito condescendentemente, parto da premissa questionável de que o artigo o funcio- 
na como um pronome que expressa uma coisa específica que foi vendida, enquanto carro 
expressa que tal coisa é um carro. 

31. Basta considerarmos o dado não ambíguo A amiga de Aline vendeu o carro para re- 
conhecermos a necessidade de tomarmos [a"amiga”de' Aline] como uma unidade sintag- 
mática, pois o sujeito de vendeu não é Aline. Para que possamos dizer que vendeu está 
adjacente a seu sujeito, é preciso conceber a existência do SN a amiga de Aline. A questão 
se coloca ainda mais acentuadamente em exemplos ambíguos envolvendo dependências de 


longa distância, como Quando você disse que Aline sumiu?, em que o pronome interroga- 


tivo quando deslocado para o início da sentença pode remeter ao dizer ou ao sumiço. O 


problema fica ainda mais complexo diante de Quando você disse se Aline sumiu?, em que 
não há ambiguidade, de tal modo que quando só pode remeter ao dizer. Gramáticas pura- 
mente lineares não têm meios de descrever esses padrões. 


32. Bem como regularidades morfológicas, cf. (37) e $3.5 adiante. 
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(36a) do que em (36b). Tal proximidade estrutural é um fator condiciona- 
dor da interação entre as estruturas métricas de ILs adjacentes, formando 
uma unidade rítmica. 


(36) SN (36b) SN 
AN Se, ado 
D Nos SN SA 
o professor /», ETs | 
P SN D N SP A 
de A o professor /», russo 
SN SA P SN 
[| de | 
N A N 
bal russo balé 


Além disso tudo, há arranjos sintáticos que uma gramática puramen- 
te linear não é capaz de gerar nem mesmo fracamente. Remeto o leitor 
a Chomsky (1956; 1957, cap 3; 1959a) e Chomsky & Miller (1963) para a 
argumentação clássica, a Lasnik (2000, cap 1; Carnie 2010: 12-17) para ex- 
posições didáticas, e a Lasnik (2015) para uma reflexão crítica e histórica. 
Por ora, é suficiente ilustrar esse ponto com uma versão adaptada do argu- 
mento clássico, inspirada em Carnie (2010: 15), a partir dos dados em (37). 


(37a) Eu desejo [que [as pessoas [que tomaram o remédio]] fiquem curadas) 


(37b) Eu sei [que [as pessoas [que tomaram o remédio]] ficaram curadas] 


Em (37a), há uma dependência entre desejo e fiquem, tal que desejo 
determina o modo subjuntivo de fiquem, sendo impossível obter *fica- 


ram/*ficam/* ficarão nesse caso. Isso independe de quantos e quais são os 
elementos entre os verbos relacionados. Entre eles, há o verbo tomaram, 
cujo modo independe de desejo e que não interfere no modo de fiquem”. 
Em (37b), com sei em vez de desejo, temos ficaram/ficam/ficarão em vez de 


33. Em (37a), poderíamos ter tomarem em vez de tomaram, sem que isso interfira no 
modo de fiquem. 
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*fiquem. Não há como capturar essa regularidade numa sintaxe puramente 
linear. É preciso, no mínimo, reconhecer um bloco que compreenda desde 
que até curadas, tal que desejo e sei se combinam com esse bloco (uma 
sentença subordinada), que, por sua vez, herda certas propriedades de seu 
subcomponente relevante: o verbo fiquem ou ficaram, que confere a toda 
a sentença subordinada a propriedade de estar no modo subjuntivo ou in- 
dicativo. Por outro ângulo, desejo e sei imporiam aos seus complementos 
sentenciais o requerimento do modo subjuntivo ou indicativo, que seria 
morfologicamente expresso no radical verbal fic-. O verbo tomaram não 
interfere nessa relação porque está profundamente encaixado na oração 
subordinada adjunto nominal do sujeito da sentença subordinada que é 
objeto de desejo ou sei. Conforme indicado pelos colchetes em (37), embo- 
ra desejo/sei esteja linearmente mais próximo de tomaram, a proximidade 
estrutural é maior em relação a fiquem/ficaram. Numa sintaxe puramente 
linear não haveria correlato algum de tais colchetes. 

Os dados positivos em (37) podem até ser fracamente gerados por uma 
sintaxe puramente linear. Um sequenciador de ILs que opere sem restri- 
ções seria capaz de gerar fracamente todo dado positivo. Mas essa falta de 
restrições o faria sobregerar todo dado negativo. Numa formulação mais 
refinada — em termos de possibilidades e restrições quanto a certos tipos de 
relações de adjacência entre ILs — o sequenciador pode permitir ou proibir 
várias relações de adjacência entre ILs. Porém, por não reconhecer uni- 
dades sintagmáticas, um simples sequenciador não captura efetivamente 
dependências entre ILs distantes. 

Ainda que uma sintaxe puramente linear fosse capaz de gerar fracamen- 
te todas e apenas as sequências de ILs legítimas, isso não seria suficiente 
(embora necessário) para ela ser adequada nos níveis descritivo e expli- 
cativo (e nos superiores). A capacidade gerativa forte de uma gramática 
proposta é de suma importância. Não basta prever quais sequências de ILs 
existem ou não na língua. É preciso prever suas propriedades relevantes 


(não só as sintáticas). A associação entre diferentes prosódias e diferentes 
significados, ilustrada em (36a) e (36b), é uma de muitas evidências de que 
a sintaxe é mais que mero sequenciamento de ILs, e que diferentes estru- 
turas hierárquicas na sintaxe (com blocos estabelecendo relações de parte 
e todo uns com os outros) determinam parcialmente outras propriedades 
dos enunciados. A ambiguidade de (29) é outra evidência da necessidade 
de a gramática prever a geração de estruturas hierárquicas em sentenças (às 
vezes, mais de uma por sentença). Explorando-se o paradigma de dados 
do qual (29) faz parte, podemos detectar, para cada sentença, outras pro- 
priedades que demandam estruturas hierárquicas na sintaxe, e portanto 
demandam que a gramática gerativa tenha capacidade gerativa forte para 
gerar as estruturas hierárquicas adequadas a cada caso, compatíveis com 
as propriedades observáveis. Comecemos retomando um par de dados já 
visto em $2.6. 


(38a) O carro, Aline vendeu rápido. (38b) O carro rápido, Aline vendeu. 


Ambas as sentenças são muito semelhantes a (29), diferindo apenas pelo 
fato de um elemento ocupar a posição de ênfase, antes do sujeito. Entre- 
tanto, nenhuma delas exibe a ambiguidade de (29). (38a) só pode ter o sig- 
nificado de (31a): “Aline vendeu o carro rapidamente, com ênfase sobre o 
carro. Em (31a), o SN objeto é simplesmente o carro, que não inclui em si o 
SA rápido. Por isso mesmo, o SA não é carregado junto com o fronteamen- 
to do SN objeto, até porque, em (31a), não existe uma unidade estrutural 
que contenha toda a subsequência o carro rápido e exclua todo o resto. 
Logo, com base em (31a), não há como se manipular essa subsequência 
para fronteá-la e enfatizá-la. Inversamente, (38b) só pode ter o significado 
de (31b): “Aline vendeu o carro que anda rápido; com ênfase sobre o carro 
rápido. Isso pressupõe a existência de um SN que corresponda à subse- 
quência o carro rápido, o que se dá somente em (31b). Aqui, o fronteamen- 
to de o carro rápido é trivial. 
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Nesse ponto, o leitor talvez se pergunte por que (38a) também não po- 
deria ser gerável a partir de (31b), já que, dada a estrutura assumida, ha- 
veria dois SNs no objeto, sendo um (o carro) subparte do outro (o carro 
rápido). Por que não se poderia mover o SN menor (o carro), sem carregar 
junto o SA rápido? Se isso fosse possível, (38a) seria ambíguo, podendo 
também significar que Aline vendeu o carro que anda rápido. A pergunta é 
pertinente. Mas note que o problema seria bem maior se (38b) pudesse sig- 
nificar que Aline vendeu o carro rapidamente. Isso seria incompatível com 
as nossas assunções de que: (i) não há em (31b) uma unidade estrutural 
correspondente a o carro rápido que possa ser movida; e (ii) a interpreta- 
ção equivalente a “Aline vendeu o carro rapidamente” depende da estrutura 
(31a) na base, Nosso problema é menor porque a impossibilidade de fron- 
teamento do SN menor 9 carro a partir de (31b) não é incompatível com a 
estrutura (31b) nem com a interpretação que ela induz. Mas a inexistência 
dessa interpretação para (38) nos revela que provavelmente há algum me- 
canismo gramatical proibitivo, cuja natureza precisa ser determinada para 
que tenhamos uma compreensão plena da gramática. Por ora, note-se que 
o dado (39) nos fornece evidência adicional que corrobora nossas assun- 


ções sobre as descrições estruturais de (29). 
(39) Aline vendeu ele rápido. 


Em (39), ele pode significar o carro. Nesse caso, o significado global 
de (39) só pode ser “Aline vendeu o carro rapidamente” (cf. (31a)), mas 
não “Aline vendeu o carro que anda rápido” (cf. (31b)). A rigor, ele em 
(39) também pode significar “o carro rápido”, caso, por exemplo, (39) seja 
precedido no discurso por algo como O carro rápido não está mais na loja. 
Porém, nesse caso, o significado global de (39) necessariamente seria “Aline 
rapidamente vendeu o carro que anda rápido”, confirmando que a subse- 
quência ele rápido em (39) não forma um SN. Seguindo estritamente a 
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gramática (35) e a estrutura (31b), não é imediatamente claro por que (39) 
não poderia ter ele como o SN menor que forma, junto com o SA rápido, 
um SN maior ele rápido que significasse “o carro rápido”. Esse fato, embora 
represente um desafio à nossa análise (obrigando-nos a descobrir o porquê 
de o pronome não poder ser o 'SN menor” da subestrutura de adjunção), 
sugere que as nossas assunções gerais estão no caminho certo, pois tanto o 
uso de SNs pronominais como o deslocamento de SNs para fins de ênfase 
exibem o mesmo padrão: (i) são consistentes com as estruturas postuladas 
em (31) e com os significados a elas associados, e (ii) quando suas possi- 
bilidades lógicas de realização não são todas atestadas, aquelas que não se 
realizam efetivamente têm em comum a preferência por afetar" o SN maior 
quando houver um SN incluso em outro, o que sugere haver um princípio 
mais geral da gramática em ação, para o qual várias implementações téc- 
nicas foram propostas (e.g. princípio A-sobre-A, ciclo transformacional, 
etc.), e cujos efeitos são observáveis em diversos fenômenos. 

O quadro apresentado até aqui ainda é impreciso e incompleto, mas é 
suficiente para se ter a dimensão da importância da capacidade gerativa 
forte em teoria gramatical”, A postulação de regras específicas e estruturas 
específicas geradas por elas demanda uma base empírica maior que apenas 
o dado específico cuja (a)gramaticalidade se pretende explicar. Uma des- 
crição estrutural deve explicar não apenas a existência da sentença, como 
também a inexistência de outras não atestadas. Sobretudo, deve explicar 
paradigmas inteiros com muitos dados, prevendo as propriedades atesta- 
das quanto a padrões sonoros e de significado. 

A partir de Chomsky (1986a), passou-se chamar de sentença o que antes 
se chamava de descrição estrutural; e o que antes era chamado de sentença 


34. CE. Miller (1999) para uma discussão aprofundada, elaborada fora do arcabouço da 
GGT, avaliando, de um ponto de vista “neutro/externo; até que ponto há equivalência for- 
mal entre diferentes teorias sintáticas. 
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passou a ser chamado simplesmente de sequência terminal”. Por trás da 
nova terminologia, há a concepção de que o que realmente importa ao fi- 
nal é a capacidade gerativa forte da gramática gerativa proposta, sendo que 
toda sentença (propriamente concebida) contém em si uma única sequên- 
cia terminal como parte de sua estrutura. Terminologia à parte, tal con- 
cepção geral já havia sido explicitada ao menos duas décadas antes, como 
enfatizado em Chomsky (1966b: 47-48) '”, 


Suponhamos que fosse de fato possível recodificar uma gramática transforma- 
cional em termos de uma gramática de estrutura sintagmática estendida de tal 
modo que sejam satisfeitos os requerimentos de equivalência gerativa fraca (ou 
seja, tal que a versão [com transformações codificadas sintagmaticamente] gera o 
mesmo conjunto de sequências, mas não o mesmo conjunto de estruturas). [...] 
Qual seria exatamente a significância linguística que essa demonstração teria? A 
resposta é: absolutamente nenhuma. [...] [levar em consideração a capacidade 
gerativa fraca só é relevante se isso fornece evidência negativa, relativamente a 
uma teoria linguística particular — se isso mostra [...] que a teoria é tão incompa- 
tível com [as sentenças dJa língua que nem mesmo o conjunto de sentenças pode 
ser gerado com sucesso. [...] [CJonsiderações de adequação descritiva e explica- 
tiva são as únicas que podem ser usadas para validar uma proposta de gramática 
ou teoria linguística. O fato de que uma gramática gera fracamente [as sentenças 
dja língua não tem relevância alguma. O que importa é que isso seja feito de tal 
modo que a cada sentença sejam atribuídas suas estruturas profunda e superfi- 
cial corretas, atingindo com sucesso o objetivo de modelar a capacidade gerativa 
forte [da língua] de um modo internamente motivado. 


35. Katz & Postal (1964: 24-25) já haviam se dado conta das armadilhas terminológicas e 
conceituais associadas às chamadas 'sentenças ambíguas; e propuseram o conceito de sen- 
toide como sendo aquilo gerado pela sintaxe, e que se definia como uma sequência terminal 
associada a uma única descrição estrutural. Nessa perspectiva, (29) seria uma sentença que 
corresponde a duas sentoides. 


36. É por esse motivo (além da limitação de espaço) que não demonstro aqui a hierarquia 
chomskyana (Chomsky 1956, 1959a, 1963), segundo a qual, grosso modo, a capacidade ge- 
rativa fraca das gramáticas lineares é um subconjunto próprio da capacidade das gramá- 
ticas sintagmáticas, que por sua vez é um subconjunto próprio daquela das gramáticas 
transformacionais. Estruturas com dependências aninhadas (formato abccba) exigiriam 
no mínimo meios sintagmáticos para serem geradas; e estruturas com dependências cru- 
zadas (formato abcabc) exigiriam no mínimo algo um pouco mais poderoso que meios 
sintagmáticos (cf. Partee et al. 1993; 429-561). Para uma discussão atualizada, recomendo 
Uriagereka (2008: cap 7). 

37. Cf. Chomsky (1982b: 65,73) sobre gramáticas sintagmáticas fracamente equivalentes às 
transformacionais. 
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Segundo Chomsky (1986a) — o cânone do modelo P&P -, a estrutura glo- 
bal de uma sentença i envolveria subestruturas associadas entre si num 
quádruplo <EP, ES, FL, FF >: estrutura profunda, estrutura superficial, 
forma lógica e forma fonética (cf. $4.3, para detalhes). 

Sob essa perspectiva, (29) não é uma sentença ambígua. Embora (31a) 
e (31b) tenham sequências terminais idênticas, elas são estruturas sintáti- 
cas distintas: i.e. organizações sintagmáticas distintas dos mesmos ILs dis- 
postos na mesma ordem linear. Assim, quando se pronuncia a sequência 
terminal de uma sentença, pronuncia-se também a sequência terminal da 
outra. A depender do contexto discursivo, o enunciado da sequência termi- 
nal pode ter uma ou outra interpretação, ou ambas. A ambiguidade estaria 
no enunciado, não nas sentenças. 

O enunciado (29) pode ser interpretado como a sentença não ambígua 
(31a) ou como a sentença não ambígua (31b). A quem ainda resiste à ideia 
de que (29) não é uma sentença ambígua, sugiro considerar o par de dados 
em (40) e suas respectivas estruturas em (41). 


(40a) Ozzy ama Sharon. (40b) Sharon ama Ozzy. 
(4la) o) (41b) s 
AN E ada 
SN, sv SN, SV 
| a 
NV SN, Ni; W SN 
Ozzy ama ] Sharon ama | 
N, N, 
Sharon Ozzy 


Não é controverso que (40a) e (40b) sejam duas sentenças distintas, 
com significados distintos, formadas a partir dos mesmos ILs, combinados 
diferentemente. A diferença entre esse cenário e aquele em (29), (3la) e 
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(31b) é apenas que, no caso anterior, as duas combinações distintas dos 
mesmos ILs coincidiam quanto à ordem de pronúncia dos ILs, ao passo 
que no último caso a ordem de pronúncia dos ILs é distinta. Essa única 
diferença tem o efeito de possibilitar ambiguidades no plano do enunciado, 
embora as sentenças continuem não ambíguas. O que acabo de afirmar 
parte da premissa (questionável) de que, no plano prosódico (curva meló- 
dica, pausas, duração de sílabas, distribuição de acentos, etc.), (31a) e (31b) 
seriam idênticas. Assim, qualquer enunciado do tipo (29) seria potencial- 
mente ambíguo, e sua associação com (31a) ou (31b) dependeria apenas 
do contexto discursivo. Entretanto, como visto em (36) acima, há casos 
em que diferentes organizações sintagmáticas afetam a prosódia de modo 
mais sutil ou mais explícito. No limite, pode haver duas sentenças distintas 
que têm a mesma sequência terminal e que jamais se confundem, pois a 
prosódia é suficientemente distinta para eliminar, de saída, qualquer ambi- 
guidade (embora, na escrita, a ambiguidade possa existir devido à ausência 
de prosódia). 

Por fim, chamo atenção para um detalhe que se segue dessa concep- 
ção. Não há 'sentenças gramaticais e sentenças agramaticais. Estritamente, 
o que é agramatical não é uma sentença. Há sequências terminais que são 
não sentenças, porque não são geráveis pela gramática (i.e. são agrama- 
ticais). Há também sequências terminais plenamente gramaticais e que, 
contudo, não são, por si mesmas, sentenças. Uma sentença pressupõe, além 
da sequência terminal gramatical, a existência de toda uma estrutura hie- 
rárquica gerada pelo mesmo conjunto de mecanismos gramaticais que gera 
a sequência terminal. Logo, em vez de 'sentença agramatical”, é mais acura- 
do dizer 'não sentença! ou “sequência terminal agramatical, Por outro lado, 
toda sentença é, por definição, gramatical. Ao concebermos a estrutura de 
uma sentença em termos do quádruplo <EP, ES, FL, FF >, este raciocínio 
se torna mais elaborado. Cada uma das quatro subestruturas pode ser gra- 


matical em si mesma sem que a combinação delas necessariamente o seja. 
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853.4, ESTRUTURA SINTAGMÁTICA - PARTE | (RAÍZES) 


Continuemos tomando por referência o dado em (29). Por ora, consi- 
dere apenas a interpretação em que rápido designa um atributo da coisa 
designada por carro, conforme a estrutura da sentença (31b). Considere a 
gramática em (42), cujo funcionamento será detalhado a seguir, primeira- 
mente de acordo com as versões iniciais da GGT. 


(42) [a] SPSN'SV; [b] SNH(DJ'N; [e] SVDVASN): [d] SADA; 
[e] SN>SN'SA; 
[f] N5Aline; [g] V>vendeu; [h] D30; [i] N5carro; [j] ASrápido. 


Cada regra se aplica a uma sequência de símbolos, e afeta exatamente 
um dos seus símbolos. O símbolo afetável pela regra é indicado na fórmu- 
la como sendo aquele que aparece antes da seta. O efeito da aplicação da 
regra a uma sequência é a reescritura (i.e. substituição) do símbolo afetado 
pela sequência de símbolos indicada na fórmula após a seta”, mantendo-se 
intacto o resto da sequência original, antes e depois do simbolo afetado. 
O símbolo “” que aparece intercalando-se entre os demais é um indicador 
da existência de concatenação entre símbolos (a rigor, entre sequências), 
estabelecendo relações de adjacência entre eles”. Um símbolo reescrevível 


38. Tal sequência de simbolos pode conter um só símbolo (no limite, poderia até ser a 
sequência nula). 


39, Faz-se oportuno aqui um alerta ao leitor que tem familiaridade com as versões recentes 
da GGT, mas não com as antigas, para que ele não faça uma leitura anacrônica desta passa- 
gem. Uso aqui o termo concatenar no seu sentido matemático clássico. Da aritmética bási- 
ca, sabemos que a multiplicação é uma operação associativa (i.e. [12X3]x2 = 12x[3x2]), 
mas a divisão não o é (i.e. [12+3]+2 * 12+[3+2]). No primeiro caso, ambas as contas 
resultam em 72; no segundo, uma resulta em 2, e a outra em 8. A concatenação é associa- 
tiva. Logo, se xy & z são concatenados, formando x"y'z; esse resultado é o mesmo obtido 
ao se concatenar x & y'z. Se for feita a primeira opção (i.e. [xºy|'z), ainda assim existe 
uma subsequência y"z em que y & z estão concatenados, independentemente de, naquela 
derivação particular, ter havido uma operação que tivesse manipulado y & z para formar 
Y'Z. A concatenação opera sobre sequências (às vezes de um único símbolo, ou mesmo a 
sequência nula) e gera relações de precedência imediata entre elas, e, consequentemente, 
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por alguma regra é não terminal (pois a construção de uma sentença não 
termina nele, continua a partir de sua reescritura). Parênteses indicam a 
opcionalidade da presença do material neles contido. Haveria também os 
símbolos terminais, correspondendo basicamente aos ILs. Cada IL codifi- 
caria em si mesmo uma 'regra de inserção lexical”, que reescreve um sím- 
bolo não terminal por um terminal (cf. (42f/g/h/i/j)). Axiomaticamente, 
assume-se que há um “símbolo inicial” Sº, a partir do qual as regras de 
reescritura se aplicam, como que “preenchendo uma sentença vazia com 
material sintático cabível” Esse seria o que chamo de “passo zero” na geração 
de uma sentença. Os próximos passos (i, ii, iii... n) sempre envolvem, cada 
um, uma sequência de símbolos formada por uma única aplicação de uma 


regra sintagmática. A cada passo, apenas a sequência criada no passo ime- 
diatamente anterior está disponível para ter um de seus símbolos reescrito. 
A essa construção passo a passo que culmina numa sequência contendo 
apenas ILs, chama-se derivação. Uma derivação termina quando não há 
nenhum símbolo não terminal na sequência formada no passo anterior. 
É por isso que os ILs são chamados de elementos terminais, já que não são 
reescrevíveis por nenhuma regra*. 

Gramáticas baseadas numa álgebra de concatenação desse tipo especi- 
fico são chamadas de [X, F], em que E é o conjunto de sequências iniciais 
admissíveis (em (42), apenas S), e F é o conjunto de regras de reescritura de 
símbolos terminais (Chomsky 1956: 117; 1957: 29). Cada sequência termi- 
nal fracamente gerada é um produto da gramática. 


entre subsequências nas extremidades delas. Diferentemente da noção contemporânea de 
conexão (cf. n. 73 adiante), a concatenação, por si só, não gera constituintes, nem relações 
de irmandade ou dominância. Isso se obtém através da relação de representação, definida 
a seguir. A conexão, por sua vez, é não associativa (i.e. [[discos'e'livros]"antigos] = [dis- 
cos'e' [livros'antigos)], algo determinado pela própria aplicação da operação de conexão). 
40. Em Chomsky (1955a: 179, 194), a derivação se inicia por J'S'J, sendo J um simbolo de 
fronteira. Chomsky (1956, 1961b, 1959a, 1965) adota a variante &S'£, em que £ também é 
inserível em fronteira de palavras. 


41. Símbolos não terminais também são ILs (compõem o 'vocabulário básico"), ainda que 
de um tipo diferente. 
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Vejamos agora duas derivações distintas, porém equivalentes, para a es- 
trutura (31b): 


(43a) sequÊnCIA REGRA APLICADA | (43a) SEQUÊNCIA REGRA APLICADA 
s z o) z 
ii SN'SV (4a) SN'SV. (4a) 
ii NºSV (ab) SNºV'SN (4c) 
iii NºV'SN (4e) : SNºvendeu"SN (4g) 
iv: NºV'SN'SA (4e) liv: SN'vendeu'SN'SA (4e) 
NºV'D'N'SA (4b) |v: SN'vendeu"D'N'ºSA (ab) 
NºVºD'N'A (4d) |vi: N'vendeu'D'N'SA (ab) 
Aline'VºD'N'A (4f) |viiz Nºvendeu"D'N'A (4d) 
viii: Aline'vendeu'D'N'A (4g) | viii: Nºvendeu"D'N'rápido (4j) 
ix: Aline'vendeu"o'N'A (4h) |ix: N'vendeu'D'carro'rápido (4i) 
x: Aline'vendeu'o'carro'A (4i) |x: Aline'vendeu"D'carro"rápido (4f) 
xi: Aline'vendeu'o'carro'rápido (4j) |xi: Aline'vendeu"o'carro'rápido (4h) 


O que nessas derivações as torna equivalentes? É preciso que ambas culmi- 
nem na mesma sequência terminal (i.e. ou “a mesma sentença; conforme 
a terminologia pré-1986). Além disso, é crucial que ambas as derivações 
envolvam as mesmas regras, aplicadas cada uma o mesmo número de ve- 
zes, diferindo quanto à ordem de aplicação das mesmas*, Considere, por 
exemplo, a subsequência o'carro'rápido (que é uma unidade estrutural em 
(31b), mas não em (31a)). Em ambas as derivações em (43), se examinar- 
mos todas as sequências da última até a primeira, sem saltar nenhuma, po- 
de-se traçar a “origem” de o'carro"rápido como sendo o mesmo SN, aquele 


42. Pode-se objetar que essa definição de equivalência de derivações é imprecisa porque 
não força a identidade do modo como um dado símbolo não terminal é reescrito por uma 
regra que inclui opcionalidade em sua formulação. Por exemplo, NP pode ser reescrito 
pela regra (35) como N ou como DºN. Note, porém, que, dada a outra condição que define 
equivalência, as sequências terminais devem ser idênticas, fazendo com que essa terceira 
condição mencionada aqui se siga como consequência natural. 
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que se concatena logo após V. No limite, pode-se fazer isso com qualquer 
unidade estrutural, verificando que ambas as derivações correspondem ao 
mesmo diagrama arbóreo em (31b) acima, um gráfico informal que in- 
dica as várias instâncias da relação formal relevante: a representação (cf. 
Chomsky 1955a: 173-194). Para toda subsequência w (terminal ou não), 
diz-se que um símbolo não terminal X representa 1y se e somente se há um 
percurso derivacional de reescritura passo a passo no qual o lugar ocupado 
por X na sequência global acaba sendo ocupado por 1. Portanto, em (43a) 
e (43b), o SN concatenado logo após V representa a subsequência o"car- 
ro"rápido". O mesmo não se daria numa derivação qualquer de (31a), pois 
não haveria nenhum símbolo não terminal que represente o'carro'rápido. 
Como se vê no diagrama em (31a), não há nenhum símbolo não terminal 
tendo “debaixo de si” toda a subsequência o'carro"rápido e nada mais. Que 
fique claro: os diagramas (31a) e (31b) não tém estatuto teórico algum, 
não são eles que determinam as relações de representação. Eles são apenas 
recursos pictóricos que refletem tais relações, estabelecidas nas derivações. 
Porém, tendo os diagramas, é prático usá-los como guia. 

A definição de representação acima é uma simplificação informal. Para 
detalhes, recomendo a introdução de Lasnik (2000: 16-34) e as apresenta- 
ções completas de Chomsky (1955a: cap VII, VIII) e Lasnik & Kupin (1977). 
Provisoriamente, chamemos de marcador sintagmático (MS) o conjunto de 
todas e apenas as sequências geradas na derivação D de uma sentença i. A 
noção de MS é crucial porque ela é que define as propriedades da geração 
forte de uma sentença. O que a gramática gera fortemente é um MS. É 
nele que está a sequência terminal gerada fracamente. Um símbolo não 
terminal X representa uma subsequência Wy se e somente se, para todas as 
sequências em D contendo X, existe em D uma outra sequência idêntica 
àquela, diferindo apenas pelo fato de Wy figurar exatamente no lugar de X, 


43. Chomsky (1956, 1957) usa outra terminologia (já presente em Chomsky (1955a: 176)), 
referindo-se ao inverso da mesma relação: i.e. o'carro'rápido é um SN (em que “A é um B” 
é o oposto de “B representa A”). 
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sem diferença quanto ao que precede ou segue as partes intercambiáveis. 
Logo, temos em (43a) que SV representa VºSN (compare (ii) com (iii)); as- 
sim como, em (43b), SA representa rápido (compare (vi) com (viii). Pelo 
mesmo critério, não temos como estabelecer, nem em (43a) nem em (43b), 
queo SN menor do objeto direto representa o'carro. Para tanto, precisaría- 


mos que houvesse, entre as sequências geradas por cada uma dessas deriva- 
ções, ao menos um par de sequências do tipo relevante (e.g. SN'V'SN'SA & 
SN'V'o'carro'SA; ou Aline'vendeu"SN'rápido & Aline'vendeu"o'car- 


ro'rápido). Tal como definida a relação de representação, a presença dessas 
outras sequências no MS é crucial para que se determine que o“carro é o 
SN menor, contido no SN maior o“carro'rápido. 

Esse 'entrave técnico” obrigou Chomsky (1955a) a definir MS de modo 
um tanto mais complexo, tal que as relações de representação desejadas pu- 
dessem ser precisamente definidas, sem que nenhuma 'escapasse por acaso”. 
Tais relações de representação são a base para se definir a noção de consti- 
tuinte, as relações de parte e todo que posteriormente viriam a ser definidas 
em termos de dominância. De um lado, representação é uma relação esta- 
belecida entre um único símbolo não terminal atômico e uma sequência de 
símbolos que decorre (diretamente ou indiretamente) da sua reescritura”. 
De outro, dominância é uma relação estabelecida entre dois símbolos atô- 
micos e À) (sendo ct não terminal e f) não terminal ou terminal), tal que o. 
domina 3 se À) está integralmente contido em cL. 

A noção de “integralmente contido” demanda uma definição precisa 
que não cabe neste momento (cf. Partee et al. 1993: 437-444). Por ora, 
podemos apelar para os diagramas arbóreos e perceber intuitivamente 


que cada símbolo 'contém integralmente” cada um dos outros símbolos 


44. rigor, segundo sua concepção original (cf. Chomsky 1955a: cap vn) a relação de repre- 
sentação também pode se dar entre duas sequências. Permito-me aqui uma simplificação 
técnica para nossos propósitos imediatos. 
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que aparecem “abaixo” dele, conectados a ele por um caminho de “galhos 
e nódulos arbóreos"”, Todos os símbolos (propriamente) dominados 
surgem na estrutura como consequência de alguma reescritura que se 
segue da reescritura do símbolo dominante. Assim, por exemplo, em 
(41b), SV domina V, SN, N,, ama e Ozzy, e nada mais'*. 

De volta ao “entrave” no formalismo de Chomsky (1955a, 1957), de- 
ve-se compreender que, por exemplo, para a geração forte de (31b), seria 
necessário estabelecer precisamente que, entre outras relações relevantes, 
a subsequência vendeu"o"carro'rápido é um constituinte de Aline"ven- 
deu"o'carro"rápido, mas vendeu'o não o é. Sabemos disso através de testes 


de constituência como os esboçados acima” (i.e. fragmentos que podem ou 
não ser alvo de elisão, fronteamento, pronominalização, etc.). Como garan- 
tir que, para toda e qualquer derivação equivalente às de (43), tal consti- 
tuência se verifica? A propósito, nem em (43a) nem em (43b), dadas como 
exemplo, podemos concluir isso pelos critérios estabelecidos acima. Para 
tanto, seria preciso que o sistema fosse capaz de determinar que vendeu"o” 
carro'rápido é representado por SV. Isso demandaria a existência de um 


45. É possível definir a dominância a partir da representação (cf. Lasnik & Kupin 1977), 
ou tomá-la como um conceito primitivo (Partee et al. 1993: 438), numa álgebra diferente 
daquela inaugurada por Chomsky (1955a), ou ainda derivá-la a partir de outras bases (cf. 
Frank & Vijay-Shanker 2001). No contexto desta seção, podemos dizer que o domina 3 se 
existe uma sequência Z tal que ct representa Z, e 3 é uma subsequência de Z. 


46. Pelas definições canônicas de dominância, todo simbolo não terminal domina a si pró- 
prio (o que valeria para SV nesse caso). Segundo concepções alternativas (e.g. Chomsky 
1986b: 92, n. 11; 1995a: 247; Kayne 1994: 134, n. 8), nada dominaria a si próprio. É essa visão 
que adotarei ao longo deste livro, por razões meramente expositivas, dado ser mais intui- 
tivo ler os diagramas arbóreos considerando que cada “nódulo da árvore só 'contém' o que 
está “abaixo de si. Como demonstram claramente Frank & Vijay-Shanker (2001), é possível 
definir dominância de um modo ou de outro obtendo gramáticas com capacidades gerati- 
vas fraca e forte absolutamente equivalentes, desde que sejam feitos os devidos ajustes nas 
partes relevantes do sistema. 

47. CE. Phillips (1996, 2003) para uma abordagem de casos em que diferentes testes apon- 
tam para diferentes conclusões acerca de quais subsequências seriam ou não constituintes, 
o que parece ser um paradoxo. Segundo o autor, tais casos se explicam em termos da inte- 
ração entre regras que ofuscam os efeitos uma da outra. 
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par de sequências como NP'SV & NP'vendeu"o'carro"rápido, ou NºSV & 


N'vendeu"o"carro"rápido, ou ainda Aline'SV & Aline'vendeu"o"carro'rá- 


pido. Por acaso, não é isso o que temos nem em (43a) nem em (43b), em- 
bora pudéssemos ter isso em outras derivações equivalentes a essas, as 
quais, contudo, não teriam como ter todas as sequências necessárias para o 
estabelecimento de todas as relações de constituência necessárias. Ou seja, 
qualquer que seja a derivação equivalente tomada como referência, não se 
pode confiar que ela será suficiente para expressar completamente todas as 
propriedades relevantes da geração forte da sentença. 

A saída de Chomsky (1955a) para esse entrave foi definir que o MS de 
uma sentença é o conjunto união das sequências geradas por todas as mui- 
tíssimas derivações equivalentes daquela sentença, como em (44a). Assim, 
não faltaria no MS nenhuma sequência necessária para que se definam to- 
das as relações de representação (e dominância) relevantes. 


(4da) | MS =[S, SN'SV, NºSV, Aline'SV, SNºV'SN, SN"V'SN'SA, 
SNºV'SN'A, SNºV'SN'rápido, SNºvendeu"SN, SNºvendeu"SN'SA, 
SN'vendeu"SN"A, SN'vendeu'SN'rápido, NºV'SN, NºV'SN'SA, 
NºVºSN'A, NºV"SNºrápido, N'vendeu"SN, N'vendeu"SN'SA, 
N'vendeu"SN'A, Nºvendeu"SN"rápido, Aline"V'SN, Aline'V'SN'SA, 
Aline"VºSN'A, Aline'V'SNºrápido, Aline'vendeu”SN, 
Aline'vendeu"SN'SA, Aline" vendeu"SN'A, Aline'vendeu"SN'rápido, 
SNºVºD'N'SA, SNºVºD'N "A, SNºV"D"N rápido, SNºvendeu"D'N 
“SA, SN'ºvendeu"D"N'A, SN'vendeu"D"N “rápido, NºV'D'N'SA, 
NºVºD'NºA, NºVºD'N'rápido, Nºvendeu"D'N'SA, 
Nºvendeu"D'N'A, Nºvendeu"D'N'rápido, Aline"V'D'N'SA, 
Aline"VºDºN'A, Aline"VºD"Nºrápido, Aline"vendeu"D'N'SA, 
Aline'vendeu"D"N'A, Aline" vendeu"D"N'rápido, SNºVºo"N'SA, 
SNºVºo"N'A, SNºV'o"N'rápido, SN'vendeu"o"N “SA, 
SN'vendeu"o"N'A, SNºvendeu"o"N “rápido, NºV'o"N'SA, 
NºVºo"NºA, NºV'o'N'rápido, Nºvendeu"o"N'SA, 
Nºvendeu"o'N'A, Nºvendeu'o"N'rápido, Aline"V'o'N'SA, 
Aline"V"o'NºA, Aline"V"o'Nºrápido, Alinevendeu"o"N'SA, 
Aline'vendeu"o"N'A, Aline'vendeu"o"N'rápido, SNºV"D'carro"SA, 
SNºV"D'carro"A, SNºV"D'carro"rápido, SNºvendeu"D'carro"SA, 
SN'vendeu"D'carro"A, SNºvendeu"D'carro"rápido, NºV'D'carro'SA, 
NºV'D'carro"A, NºV"D'carro"rápido, Nº'vendeu”D'carro'SA, 
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Nºvendeu"D'carro"A, Nºvendeu"D'carro'rápido, 
Aline'V'D'carro"SA, Aline”V'D'carro"A, Aline'V"D'carro'rápido, 
Aline'vendeu"D'carro"SA, Aline" vendeu"D'carro"A, 
Aline'vendeu"D'carro"rápido, SN"V'o"carro"SA, SN"V'o"carro"A, 
SNºV'o'carro"rápido, SN'vendeu"o'carro'SA, SN'vendeu'o"carro"A, 
SNºvendeu"o'carro"rápido, NºV'o'carro'SA, NºV'o'carro"A, 
NºV'o'carro'rápido, N'vendeu'o"carro'SA, Nºvendeu*o'carro"A, 
Nºvendeu"o“carro'rápido, Aline"V'o'carro'SA, Aline"V'o'carro"A, 
Aline"Vo“carro'rápido, Aline'vendeuo"carro'SA, 
Aline'vendeu"o"carro"A, Aline” vendeu"o'carro"rápido! 


Embora essa concepção de MS cumpra o seu papel, fica flagrante o quão 
“pesado” é esse formalismo, que pressupõe que a geração de uma sentença 
necessita que todas as múltiplas derivações equivalentes dela sejam execu- 
tadas em paralelo para que se possa extrair delas a totalidade das sequências 
geradas*, Esse foi basicamente um fardo" que a GGT carregou durante anos, 
até que Lasnik & Kupin (1977) brilhantemente simplificaram todo o sistema, 
substituindo a noção de MS pela de MSR (i.e. marcador sintagmático reduzi- 
do). Os detalhes dessa proposta ultrapassam os limites desta introdução. Ate- 
nho-me apenas ao essencial, mas alerto o leitor que esse trabalho teve uma 
importância capital na construção da concepção de estrutura sintagmática 
da fase seguinte da GGT: a Teoria X-Barra. Não se pode verdadeiramente 
compreender um sem o conhecimento do outro. Em suma, o MSR corres- 
pondente à sentença (31b) das derivações em (43) seria como em (44b): 


(44b) | MSR = [S, AlineSV, Aline"V'o"carro"rápido, Aline” vendeu"SN, 
Aline'vendeu"SN'rápido, Aline" vendeu"o'carro"SA, 
Aline'vendeu"o"carro"A, Aline"vendeu"o"N'rápido, 
Aline"vendeu” D'carro"rápido SN'vendeu"o"carro"rápido, 
Nºvendeu"o'carro'rápido, Aline" vendeu'o'carro"rápido| 


48. A história derivacional aqui tratada refere-se apenas a operações no plano abstrato da 
competência, e não a um passo a passo do desempenho efetivo (cf. Chomsky 1961b). Para 
uma reflexão ampla sobre o problema da realidade psicológica de teorias da competência 
recomendo acompanhar a obra de Colin Phillips. 
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Esse objeto matemático corresponde exatamente ao diagrama arbóreo em 
(31b) acima. Nele, encontramos todas e apenas as sequências necessárias 
para que se estabeleçam todas as relações de representação desejadas, con- 
forme o critério explicitado acima. Um MSR, por definição, contém exata- 
mente uma sequência terminal e um número qualquer de monossequências 
(definidas como sequências contendo exatamente um símbolo não termi- 
nal e um número qualquer de símbolos terminais). Lasnik & Kupin (1977) 
definem então as condições necessárias para que um MSR seja gramatical- 
mente bem-formado. Detalhes técnicos à parte, o símbolo não terminal de 
cada uma das monossequências deve representar alguma subsequência da 
sequência terminal. Isso inclui o símbolo S, que representa a sequência 
terminal inteira (uma subsequência não própria de si mesma). 

O mais importante sobre esse modelo é que um MSR não é construído 
a partir de um MS, retirando-lhe as sequências “inúteis. Um MSR é cons- 
truído diretamente a partir dos símbolos terminais e não terminais do lé- 
xico, pela concatenação desses símbolos e a formação de sequências, em 
conformidade com os requerimentos de boa formação de MSRs. Isto sig- 
nifica que um MSR é formado “numa tacada só; sem todos aqueles passos 
derivacionais do modelo inaugurado em Chomsky (1955a). Nesse sistema, 
o formato dos sintagmas não é determinado por regras de reescritura, mas 
por regras declarativas de boa formação de estrutura, conforme as relações 
de dominância e precedência entre suas partes. Para além da simplificação 
do sistema como um todo, a importância da reconcepção da estrutura sin- 
tagmática em termos de MSRs reside no fato de que, no subcomponente 
não transformacional da gramática, o sistema não é derivacional, Tudo o 
que se tem é uma representação sintática da sentença. O MSR é a coleção 
de todas as relações de representação que definem a sentença. O subcom- 
ponente sintagmático da gramática passa a ser reconcebido como um con- 
junto de requerimentos sobre a forma das representações, e não como um 
conjunto de procedimentos para se gerar, serialmente, as sequências que, 
juntas, definem uma sentença. Isso abriu caminho para as concepções mais 
contemporâneas de estrutura sintagmática e transformacional do modelo 
de Princípios & Parâmetros (cf. $3.6 e $3.7). 
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83.5. ESTRUTURA TRANSFORMACIONAL - PARTE | (RAÍZES) 


Esta seção descreve a concepção de transformações hegemônica na 
GGT antes do advento dos MSRs que culminaram na Teoria X-Barra, a 
ser tratada em $3.6. A concepção contemporânea de transformações será 
apresentada em $3.7. 

Como vimos em $3.4, a concepção de estrutura sintagmática que sub- 
jaz à concepção de subcomponente transformacional das primeiras duas 
décadas e meia da GGT é toda baseada em regras de reescritura que deter- 
minam uma derivação, gerando, serialmente, sequências de símbolos. Não 
se deve confundir aquilo com as transformações propriamente ditas". Tal 
como definidas, as regras de reescritura não são transformacionais, ainda 
que a aplicação de cada regra implique na criação de uma nova sequência a 
partir de uma sequência anterior. Mas essa substituição de um símbolo por 
uma subsequência dentro de uma sequência maior não é o que se enten- 
de tecnicamente por transformação. Regras de reescritura são insensíveis a 
contexto estrutural. Ou seja, a regra 'SN5(D)"N' afeta todo e qualquer SN, 
independentemente de onde ele possa figurar na sequência de origem (e.g. 
(i) SNºVP, (ii) D'N'V'SN, (iii) D'N'P'SN"V'SAdy, etc.). Regras trans- 
formacionais afetam um ou mais elementos da estrutura a depender de 
certas relações estruturais que ele(s) mantenha(m) com outros elementos 
da estrutura. Chomsky (1965: 89) esclarece: 


Uma transformação gramatical [...] tipicamente se aplica a uma sequência com 
uma descrição estrutural particular. Logo, a aplicação de uma regra desse tipo 
à última linha de uma derivação depende em parte das linhas anteriores. Uma 
transformação gramatical é, enfim, uma regra que se aplica a marcadores sin- 
tagmáticos, e não a sequências formadas a partir do vocabulário de simbolos 
terminais e não terminais da gramática. 


As menções anteriores a transformações foram apenas esboços. Através 
de alguns exemplos-chave é possível avançarmos rumo a uma compreensão 


49, Uma exceção a isso é o modelo específico de Chomsky (1965), no qual as regras de 
inserção lexical do próprio subcomponente sintagmático são caracterizáveis como 'trans- 
formações locais" (cf. 83.6). 
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satisfatória para nossos objetivos imediatos. O que se segue é uma adap- 
tação do argumento clássico de Chomsky (1955a, 1957) a favor de regras 
transformacionais, cuja base empírica são dados do inglês”. A essência do 
fenômeno é verificável também em português, e em diversas línguas. Como 
em qualquer adaptação didática, alguns detalhes não correspondem exa- 
tamente ao original. A argumentação original envolvia uma base empírica 
maior, e a interação entre vários outros fatos relacionados à morfologia ver- 
bal; o que torna aquela argumentação mais forte que esta. 

Os dados abaixo são idênticos quanto ao verbo principal (beber), o 
sujeito (Alice), o objeto (chá) e o tempo verbal (pretérito imperfeito do 
indicativo). O que os distingue são as (im)possibilidades de organização 
dos verbos auxiliares ter, estar e dever: como eles interagem entre si e com 
beber. Comecemos pelo paradigma básico de dados positivos. 


(45a) Alice bebia chá. (45b) Alice estava bebendo chá. 

(45c) | Alice tinha bebido chá. (45d) Alice tinha estado bebendo chá. 

(45e) - Alice devia beber chá. (45f) Alice devia estar bebendo chá. 
(45g) Alice devia ter bebido chá. (45h) Alice devia ter estado bebendo chá. 


A partir deles (e de dados negativos relacionados a seguir), chegamos, no 
nível observacional, às nove generalizações empíricas em (46) quanto ao 
sistema verbal. 


(46a) A presença do verbo principal é obrigatória (cf. *Alice chá; * Alice tinha 


estado chá); 
(46b) A presença da flexão verbal principal (Flex = tempo & concordância) é 
obrigatória (cf. “Alice beb- chá; * Alice est- bebendo chá; * Alice t- bebido chá); 


(46c) A presença de verbos auxiliares é opcional (cf. (45a)); 


50. Remeto o leitor a Lasnik (2000: cap 3) e Trautwein (2013) para desenvolvimentos con- 
temporâneos desta análise, aplicados a uma base empírica do inglês e do português, res- 
pectivamente. 
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(46d)! Quando há verbos auxiliares (todos os três, ou quaisquer dois, ou qual- 
quer um), a ordem entre eles é sempre MopaL+TEr+EstaR (cf. *Alice 
tinha devido beber chá, “Alice tinha estado devendo beber chá). 

(46e) Havendo qualquer auxiliar, este se localizará “entre o sujeito e o predicado” 
(cf. “Está Alice bebendo chá; * Alice bebendo está chá; * Alice bebendo chá 
está); 

(46f) A realização de Flex ocorre sempre no elemento verbal (principal ou au- 
xiliar) que for o primeiro entre os elementos verbais da estrutura global, 
qualquer que seja ele (cf. “Alice estando bebia chá; *Alice tido bebia chá, 
“Alice poder bebia chá); 

(46g) Sempre que houver um MopaL, o elemento verbal imediatamente se- 
guinte (qualquer que seja ele) carrega a morfologia de infinitivo =r (cf. 
“Alice devia estado bebendo chá; “Alice devia tendo bebido chá, “Alice 
devia bebendo chá); 

(46h) Sempre que houver o auxiliar Ter, o elemento verbal imediatamente se- 
guinte (qualquer que seja ele) carrega a morfologia de particípio -do (cf. 
+Alice tinha bebendo chá; “Alice tinha beber chá, *Alice podia ter 
bebendo chá); 

(461)? | Sempre que houver o auxiliar Estar, o elemento verbal imediatamente 
seguinte (qualquer que seja ele) carrega a morfologia de gerúndio -ndo 
(cf. *Alice tinha bebendo chá; *Alice tinha beber chá, *Alice podia ter 
bebendo chá). 


51, Para efeitos de exposição, escolhi o modal dever, que é mais 'bem-comportado” nesse 
sentido. Um modal como poder, por exemplo, apresenta mais flexibilidade de ordenamento 
(cf, ZAlice podia ter estado bebendo chá, Y Alice tinha podido estar bebendo chá, “Alice 
tinha estado podendo beber chá). Nisso, poder difere significativamente da sua contraparte 
em inglês (i.e. can), cujo ordenamento no início da sequência é rígido. Sobre esse assunto, 
remeto o leitor a Trautwein (2013), que aborda a questão a partir de recursos técnicos mais 
contemporâneos (cf. Lasnik 2000; Guimarães & Mendes 2013). Por ora, restrinjamos nossa 
base empírica a casos com modais de ordenamento mais rígido, cientes de que, se formos 
utilizar o aparato técnico clássico para modelar plenamente os dados do portugués, preci- 
saríamos flexibilizar a regra sintagmática em (48b) quanto ao ordenamento do modal em 
relação aos demais auxiliares. 

52. Dados como Alice está feliz não são propriamente contraexemplos a (46i), pois feliz 
não é um elemento verbal. Dados como Alice está cansada parecem um pouco desafiado- 
res, já que cansada se assemelha a uma forma participial de cansar. Contudo, se a análise de 
Trautwein (2013) estiver certa, teríamos aí um adjetivo. 
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Pode-se tomar cada generalização dessas como uma regra do sistema, 
devidamente formulada com o aparato técnico da teoria. Mas isso não 
passaria de uma coleção aleatória de requerimentos não relacionados. Al- 
ternativamente, em vez de 9 regras que 'implementem” os fatos em (46), 
poderíamos ter 8 regras de reescritura de SV, como em (47). 


(47) [a] SV5V"Flex(SN); 
[b] SV3est-"Flex'V'Ger"(SN); 
[c] SV>t-"Flex"V"Part'(SN); 
[d] SV>t-"Flex"est-"Part"V"Ger"(SN); 
[e] SV>Mop'Elex'V'Inf (SN); 
[f] SV>Mop"Flexest-"Inf"V "Ger (SN); 
[g] SV>Mop"Elex't-"Inf"V"Part (SN); 
[h] SV>Mop'Flex't-"Inf“est-"Part*V"Ger"(SN); 


Essas 8 versões da regra de reescritura de SV estão de acordo com os 
fatos em (46), mas elas apenas catalogam uma lista de tipos de sequên- 
cia admissíveis, sem capturar efetivamente nenhuma das generalizações, 
pois não há qualquer relação entre as regras, cada uma com um formato 
singular, e todas coexistindo por pura coincidência. Elas não passam de 
versões mais 'formulaicas” das sentenças efetivas em (45), um típico mapa 
de Borges! 

Pondo de lado detalhes de implementação técnica de três versões da 
mesma ideia, a solução dada por Chomsky (1955a, 1957, 1965) parte das 
duas regras em (48) no subcomponente sintagmático (omitindo as regras 
de reescritura de SN e de SV, já vistas). 


(48) [a] S5SNºAux'SV [b] Aux Flex"(Mop'Inf)'(Ter'Part)(EsraR Ger) 
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A regra (48a) dá conta do fato em (46e), e também de (46a), porque o 
SV pressupõe um V*. A regra (48b) tem várias partes. O fato de Flex ser 
o único elemento obrigatório (não parentetizado) dá conta de (46b) e de 
(46c). A ordem fixa entre os auxiliares expressa em (46d) está codificada 
na regra (48b) através da ordem entre os elementos parentetizados. O fato 
em (46f) se segue de Flex ser o primeiro elemento da sequência e os demais 
opcionais, fazendo com que qualquer um dos elementos verbais possa fi- 
gurar imediatamente após Flex, mesmo que não seja “o primeiro da fila na 
fórmula, pois seu(s) precedente(s) pode(m) estar ausente(s). Os parênteses 
abrangem sempre um verbo auxiliar - Mop, TER, ESTAR — necessariamen- 
te junto com um afixo de natureza aspectual específico — Inf, Part, Ger, 
respectivamente — de modo que a presença de um dado auxiliar implica 
a presença de um certo afixo, e vice versa. Isso dá conta parcialmente dos 
fatos em (46g), (46h) e (46i). Há, porém, uma discrepância grande quanto 


à ordem linear dos elementos. Chegaremos lá. 


Aplicando-se (48a) e (48b), teríamos o esqueleto básico em (49), cujo 
elemento Aux pode ser expandido de qualquer das formas listadas em (50), 
todas oriundas de (48b)*: 


53, Nas análises originais de Chomsky (1955a, 1957), os auxiliares eram concebidos como 
formando um constituinte junto com o verbo principal dentro do SV, excluindo o objeto, 
i.e. |“ Aux['beb-]] ['Schá]]. Chomsky (1965: 102, 106-108), postulou o Sintagma Predica- 
do, formado por Aux seguido de um SV que por sua vez contém o verbo principal e o objeto. 
Tais detalhes não afetam a essência desta apresentação, baseada num esqueleto sintagmá- 
tico que foi adotado por grande parte dos autores ao longo das décadas de 1960 e 1970. 
54, Pode-se objetar que a forma de apresentação de (48b), com parênteses, seria apenas 
um truque notacional para abreviar o que de fato seriam 8 regras (cf. (50)). CE. Chomsky 
(1965: 42-44) para uma extensa argumentação de que, embora os parênteses sejam atalhos 
expositivos, eles expressam generalizações robustas sobre regras possíveis em linguagem 
natural que excluem “pacotes de regras” não abreviáveis via parênteses. 
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(49) s (50a) Flex 
(50b) FlexEsrar'Ger 


SN Aux SV 
LES A (50c)  FlexTER'Part 
N V SN (50d) FlexTer'Part'Esrar'Ger 
ame abs h (50e)  Flex/Mop'Inf 
chá (50f)  Flex'Mop'InfEstar'Ger 


(50g)  FlexMop'InfºTer'Part 
(50h)  Flex'Mop“Inf TerPartEstar"Ger 


Disso decorrem as sequências em (51), que correspondem aos dados em 
(45) acima, em que a maioria dos fatos foram capturados, exceto o impor- 
tantíssimo detalhe da ordem. 


(5a) Alice'-ia"beb-"chá (51b) Alice'-ia“est-"-ndo"beb-"chá 
(51c) Alice"-ia"t-"-do"beb-"chá (51d) Alice'-ia't-"-do'est--do"beb-"chá 
(51e) Alice"-ia"dev-"-r'beb-"chá (51f) Alice"-ia"dev-"-r"est-"-ndo"beb-"chá 


(51) Alice'-ia"dev-"-: 


-"-do"beb-"chá (51h) Alice'-ia"dev-"-r"t"-do est” -ndo'beb-"chá 


Aos produtos em (51) gerados pelas regras em (50) aplica-se a transfor- 
mação (52) tantas vezes quanto for preciso, dado o número de afixos 
verbais de tempo (Flex) e aspecto (Inf, Ger, Part), representados por Af; 
e de 'elementos verbais” representados por v, que engloba a superclasse 
de V e auxiliares, que têm a capacidade de servir de base para a sufi- 
xação de Af. V e auxiliares também codificam propriedades semânticas 
relacionadas a eventos (cf. Lasnik 1990: cap 5, n. 5, para detalhes formais da 
ontologia de Afe v). 


(52) Af'v D varre (Chomsky 1956: 120; 1957: 39, 113) 


55. Isso não significa que (52) seria a primeira transformação a afetar o produto das re- 
gras sintagmáticas. Chomsky (1955a, 1957) postulava transformações 'anteriores' a (52), 
incluindo a inserção lexical do morfema que reescreve Flex, de modo sensível ao contexto 
estrutural, conforme as características do SN sujeito. 
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A regra de salto do afixo em (52) estabelece que um Af se desloca para 
imediatamente após o elemento terminal que o segue imediatamente, se e 
somente se este elemento for um v; e após o deslocamento é inserido um 
símbolo de fronteira de palavra “* logo após Af. A título de exemplifi- 
cação, tomemos (45d) acima, e vejamos como aplicações sucessivas de 
(52) a ele acabam por gerá-lo. É o que temos no fragmento de derivação 
em (53) abaixo. O impacto disso na estrutura da sentença em termos de 
geração forte está ilustrado no par de diagramas em (54), cujos detalhes 


técnicos estão explicados de forma acessível em Lasnik (2000, cap 2). 


(53a) Alice” -ia “t-*-do* est-” -ndo * beb-* chá 

(53b) Alice” t-"-ia” &” do” est-” -ndo * beb-” chá 

(53c) Alice"t-"-ia" &"est-” -do” &” -ndo” beb-” chá 

(53d) Alice"t-"-ia" 4" est-" do” &" beb-* ndo" 4º chá (=45d)* 


(54a) s [diagrama arbóreo de (53d)] 
Aux 
SN sv 
| Ss, 

N 4 SN 

Alice Flex t--do est- -ndo  beb- | 

I N 

-ia chá 


56. Entre (53d) e (45d), aplicam-se ainda regras do componente morfofonológico que 
convertem cada elemento terminal da sintaxe de sua forma mais abstrata em sua forma 
efetivamente pronunciável, devidamente ajustada ao contexto morfofonológico imediato 
(Chomsky 1951, 1955a, 1957, 1965; Chomsky & Halle 1968). 
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SN sv 
| O 
N v SN 
Alice Flex t est- beb- | 
N 
chá 


t- -i(nh)a é est-(a)-do 4 beb-(e)-ndo & 


Um aspecto dessa análise que salta aos olhos é que tanto regras sintag- 
máticas como transformacionais manipulam não apenas palavras e sin- 
tagmas, mas também morfemas. Aliás, o estabelecimento do que é uma 
palavra só se dá em definitivo ao final do processo sintático (aliás, já na 
interface com a morfofonologia, cf. Chomsky & Halle 1968: cap 8). Uma 
versão da GGT bastante produtiva hoje, a Teoria da Morfologia Distribuí- 
da (cf. Halle & Marantz 1993, et seg.) leva essa ideia ao extremo, não fa- 
zendo distinção alguma entre combinatória de morfemas e combinatória 
de palavras. Tudo seria sintaxe, na qual distinguimos entre microssintaxe 
e macrossintaxe apenas para fins descritivos. É importante notar que a 
semente dessa ideia já estava presente nas primeiras versões da GGT”, 

Extrapolando o exemplo ilustrativo acima, é preciso identificar as ca- 
racterísticas que definem uma regra como sendo uma transformação. 
O que se segue nesta seção se restringe às primeiras versões da GGT. 
Elaborações ulteriores serão tratadas na seção $3.7. 

Como já dito, regras sintagmáticas são insensíveis ao contexto estrutu- 
ral do elemento afetado (i.e. livres de contexto), enquanto regras transfor- 
macionais são sensíveis a ele (i.e. sensíveis a contexto). Toda transformação 


57. Sejamos justos. O insight de que morfologia e sintaxe seriam indistinguíveis (ambas cal- 
cadas em relações sintagmáticas e associativas) foi de Saussure (1916: 170-188). Porém, para 
além do insight, ele não forneceu um sistema concreto de combinatória morfossintática 
integrada que faça previsões testáveis específicas. 
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tem especificada em sua definição uma análise estrutural (AE), que consiste 
na especificação do(s) elemento(s) afetado(s) juntamente com o contexto 
estrutural no qual ele(s) aparece(m). Além disso, é especificada uma mu- 
dança estrutural (ME), que define a forma da estrutura produzida pela apli- 
cação da regra. Essa sensibilidade ao contexto estrutural (na 'entrada' e na 
“saída” da regra) implica que uma transformação lide necessariamente com 
MSs inteiros, não com uma sequência, muito menos com um símbolo iso- 
lado. Vejamos um exemplo concreto disso a partir de (55). 


(55a) O professor recomendou qual livro aos alunos. 


(55b) [* qual livro], o professor recomendou t, aos alunos? 


Em (55a) temos o que seria a estrutura de partida para a aplicação da 
regra de fronteamento de sintagmas interrogativos em português, que 
então gera (55b). Em (56), temos uma versão simplificada do que seria 
tal regra, especificadas a AE e a ME (cf. Chomsky 1964: 38). 


(56) AE [iJ=X-a-Y; ME=%,-%-X% ? MMX 
[i)=X-quiW=y; 


Comecemos pela AE, que, nesse caso, se define em duas partes. X, Y 
e W são variáveis que representam quaisquer subsequências de símbolos. 
O símbolo a. é um nódulo não terminal (aqui um SN, mas podendo ser 
um SA, SAdv ou SP). A parte (i) da AE especifica, portanto, a sequência 
X'aY como parte da “entrada” da regra, tal que se identificam nela três 
termos, separados por travessões. O termo-chave aqui é €L, corresponden- 
te ao sintagma a ser fronteado. A parte (ii) especifica que aquele termo 
a precisa representar uma subsequência qu"W para que ele seja passível 


58. Dados como (38) acima exemplificam o que ora chamo informalmente de “frontea- 
mento enfatizador (sem distinguir entre focalização e topicalização para nossos propósi- 
tos), cuja regra responsável seria semelhante a (56), diferindo quanto à presença ou não da 
condição [ii] na AE, bem como quanto à especificação de ct. 
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de fronteamento. Essa subsequência representada por & está especificada 
como iniciando por um IL do tipo QU (i.e. qual, quanto, quem, quando, 
etc.) imediatamente seguido de uma subsequência W qualquer, que pode 
também ser uma sequência nula (o que X e Y também podem ser, aliás)”. 
Em (55) à é o SN objeto direto, e qu"W corresponde a qual"livro (e tam- 
bém a qualN). 

Passemos à ME. Os símbolos x, %, e Xp separados por travessões, re- 
ferem-se aos mesmos três termos especificados na AE, sendo os índices 
numéricos indicadores da ordem de aparição deles na AE. A seta indica 
que a sequência ao lado esquerdo, presente no MS de entrada, tem como 
correspondente no MS de saída a sequência dada à direita da seta. Nesse 
caso, por se tratar de uma transformação de movimento, houve um rear- 
ranjo na ordem dos termos. Outros tipos de transformação podem apagar 
termos, acrescentá-los, ou substituí-los por outro material, ou fazer alguma 
combinação dessas coisas. Transformações tomam como 'entrada' um MS 
inteiro e dão como “saída” outro MS inteiro, sendo eles diferentes quanto às 
especificações da transformação e idênticos em todo o resto. Outro ponto 
importantíssimo é que, dado o formato da ME, e dado que x, corresponde 
tanto a O. como a quW, o impacto de aplicação da regra é o fronteamen- 
to tanto de . como de quaisquer subsequências representadas por ot (in- 
cluindo qu'W). Assim, o MS “de saída” apresenta um rearranjo na ordem de 
termos em várias das sequências correlatas àquelas indicadas na AE. Uma 
transformação, portanto, correlaciona toda uma “estrutura arbórea” pre- 
viamente dada com toda uma “estrutura arbórea” nova, Mas as noções de 
“velha” e “nova” não devem ser tomadas literalmente, 'cronologicamente” (cf. 
Chomsky 1961b). Volto a esse ponto adiante em $3.7º. 


59, Exemplos em que W, X e Z são nulos seriam, respectivamente, (i) Quem o professor 
apresentou t para os alunos? Qual professor t leu o livro? e Qual livro o professor leu tê 
60. A título de completude, apresento abaixo a regra de salto do afixo em (52) segundo 
esse formalismo. 


(1) SA=X-Af-v-Y; ME=7,-K, 4% k-%- XX, (Chomsky 1957: 113). 
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Quando das primeiras formulações de transformações (Chomsky 
1955a), tinha-se um modelo poderoso demais, no qual nada impedia, a 
priori, que uma tranformação qualquer pudesse afetar a estrutura de en- 
trada de modos imprevisíveis pela teoria geral da gramática. A despeito 
do relativo sucesso na formulação de muitas regras, havia o problema de 
que quaisquer rearranjos imagináveis eram bem recebidos como poten- 
cialmente possíveis pela teoria geral da gramática. Obviamente, em última 
instância, era uma questão empírica verificar se uma dada transformação 
hipotetizada correspondia ou não aos fatos. Porém, em primeira instância, 
uma teoria geral sem freios rígidos quanto ao que pudesse ser uma trans- 
formação numa língua particular enfrentava um sério problema quanto à 
adequação explicativa, pois concebia-se que a criança não tinha nenhum 
viés significativo quanto ao que pudesse ser descartado de antemão como 
hipótese de transformação subjacente aos dados que ela escutava. Ao longo 
da década de 1960, começou-se a desenvolver toda uma ideia de restrições 
sobre o formato geral das transformações, atribuindo tais freios à GU ina- 
ta. Entre as muitas obras a esse respeito, destaca-se a revolucionária tese 
de doutorado de John R. Ross (1967), Constraints on variables in syntax, 
orientada por Chomsky. Em (57), apresento uma versão adaptada e muito 
simplificada de uma dessas restrições”, que estaria por trás dos dois casos 
de escolha por afetar o SN maior em detrimento do SN menor" abordados 
anteriormente em (38) e (39). 


(57) Para qualquer transformação T cuja ME afete um SN (deslocando-o, apa- 
gando-o, substituindo-o por outro elemento, etc.) previsto na AE, se houver 
dois SNs em princípio afetáveis por T, tal que um domine o outro, então T 
deve necessariamente afetar o SN dominante, em detrimento do dominado. 


Além de prever os padrões observados em (38) e (39), a restrição em 
(57) também dá conta de casos conhecidos como ilha de SN complexo 


61. Essa formulação foi sugerida em Chomsky (1964: 46) e reconhecida como “poderosa 
demais”, algo que Ross (1967) elaborou bastante a respeito. Contudo, ela se presta bem para 
os nossos objetivos imediatos. 
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como exemplificado abaixo“. Primeiramente, constate-se a aceitabilidade 
do dado (58b), gerável a partir de (58a), evidenciando que um SN interro- 
gativo pode se deslocar entre posições muito distantes, com várias camadas 
de encaixamento entre elas. Em (58b), embora o movimento atravesse vá- 
rias camadas, nenhuma delas é um SN, não violando (57), portanto. 


(58a) Você disse [º que [* o jornalista] noticiou [* que [“ Anita] atacou [** quem] |] 


(58b) [" quem], você disse [* que [* o jornalista) noticiou [º que [S* Anita) atacou t, ])? 


O mesmo não ocorre com (59b), cuja inaceitabilidade pode ser atribuída 
à restrição em (57), que proíbe que o SN quem seja movido para fora do 
SN maior no qual está contido (i.e. a notícia de que Anita atacou quem). 
Note-se que, do ponto de vista estritamente semântico-pragmático, não 
há anomalia alguma quanto ao significado pretendido de (59b), i.e.: “Eu e 
você sabemos que existe uma pessoa x tal que você alardeou a notícia de 
que Anita atacou x; e eu peço que você me revele a identidade de x”. Isso 
indica que a agramaticalidade do dado se deve a uma restrição puramente 
sintática, como (57). Em (59c), temos uma situação em que todo o SN 
complemento de alardeou é realizado como um pronome interrogativo e 
então fronteado, não violando (57), portanto. 


(59a) Você alardeou [** a notícia [*” de [* que [* Anita] atacou [*N quem]])] 
(59b) * [ quem], você alardeou [** a notícia [* de [º que [** Anita] atacou t, ]]] ? 


(59) [* o que], você alardeou t,? 
Após essas considerações gerais sobre o formato básico das transforma- 


ções, esboço agora considerações gerais de outra ordem, concernentes ao 
formato geral do subcomponente transformacional segundo as primeiras 


62. Esta restrição é da 'mesma família" da restrição sobre extração de dentro de adjuntos 
esboçada em $2.6. 
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versões da GGT, o qual estabelece como as várias transformações intera- 
gem para produzir o formato final de uma sentença. 

Primeiramente, há a distinção entre as transformações de aplicação 
obrigatória e as de aplicação opcional. A regra de salto do afixo em (52) 
é um exemplo de transformação obrigatória. A regra de fronteamento 
de sintagmas interrogativos, esboçada em (56), tem correlatos em diver- 
sas línguas, com algumas diferenças em torno do formato básico. Seu 
estatuto em português brasileiro é um tema complexo que não há como 
elaborar aqui. Por ora, assumamos simplificadamente que se trata de 
uma regra opcional dado ser possível formar uma interrogativa genuína 
estruturada essencialmente como (58a) ou (59a), acrescendo-se apenas 
os devidos ajustes prosódicos indicadores de interrogação. Chomsky 
(1955a, 1957: 45-46) define como sentença nuclear (kernel sentence), uma 
sentença cuja geração envolveu, além de regras sintagmáticas, apenas 
transformações obrigatórias. Esse conceito é distinto do de Estrutura 
Profunda introduzido por Chomsky (1965), que se refere ao produto da 
aplicação de regras sintagmáticas apenas. Há, no entanto, uma equiva- 
lência parcial entre eles, tomados como o elo comum” entre sentenças 
superficialmente diferentes que compartilham propriedades-chave. O 
exemplo canônico disso à época era a dicotomia ativa/passiva (e.g. Gru 
adotou Agnes; Agnes foi adotada por Gru), que aliás veio a ser questio- 
nado posteriormente, como veremos em $4,3. 

Em segundo lugar, nas versões iniciais da GGT, a fim de explicar a 
interação entre certos processos gramaticais, assumia-se, com base em 
padrões observáveis, que as transformações de uma gramática particu- 
lar são ordenadas em relação umas às outras, numa fila que codifica o 
'momento” da aplicação de uma transformação como anterior ou pos- 
terior ao da aplicação de outra. Muito se investigou na época sobre or- 
denamentos intrínsecos e extrínsecos (i.e. casos em que a AE de uma 
transformação pressupõe logicamente uma subestrutura cuja geração 
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depende da aplicação de outra transformação, e casos em que o ordena- 
mento ditado pela gramática é arbitrário) ou até “livres”. 

Em terceiro lugar, friso que a dicotomia “obrigatórias e opcionais não 
exibe correlato com a dicotomia “primeiras e últimas, podendo trans- 
formações intercalar-se de vários modos; e isso é um dos fatores que dis- 
tanciam o conceito de sentença nuclear do de Estrutura Profunda. Outro 
fator é a já mencionada dicotomia entre transformações singulares (que 
afetam elementos dentro de um único MS) e generalizadas (que 'mes- 
clam” dois MSs desconexos e derivacionalmente independentes num 
terceiro, unificado). O conceito de Estrutura Profunda pressupõe um 
único MS unificado já na base, antes das transformações. 

Outra tipologia importante concerne às operações elementares, que 
constituem o rol básico das MEs que a teoria geral da gramática pre- 
via para as transformações. São elas: (i) substituição de um termo por 
outro, (ii) apagamento de um termo da sequência; (iii) permutação de 
termos na ordem da sequência; (iv) adjunção de um termo a outro; e (v) 
adjunção de material novo antes ausente na AE de “entrada! 

O esquema abaixo resume o “fluxo” derivacional dentro do subcom- 
ponente transformacional nas primeiras versões da GGT. Em (60), MS, 
é a estrutura de “entrada”: o MS produto de uma derivação terminada 
do subcomponente sintagmático; e MS, é o último MS gerado pelo sub- 
componente transformacional, após sucessivas aplicações de transfor- 
mações (1, Td E, “T,) que geram MSs intermediários. 


(60) MS, > MS, 


Nas versões anteriores a Chomsky (1965) — e portanto anteriores ao con- 
ceito de Estruturas Profunda e Superficial — a parte transformacional da 
construção de uma sentença era entendida como envolvendo uma série de 
transformações tal que o MS gerado por uma servia como ponto de parti- 
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da para a aplicação da próxima transformação. Ou seja, apenas a primeira 
transformação tem acesso à estrutura sintagmática pura MS,. As demais 
transformações se aplicam a MSs, cujos formatos derivam de transforma- 
ções previamente aplicadas. 

Nesse modelo, a estrutura que interage diretamente com o compo- 
nente fonológico da gramática é MS. Quanto à interação com o sub- 
componente semântico, a conjectura mais completa à época foi conso- 
lidada em Katz & Postal (1964), que muito refletiram sobre qual seria a 
estrutura a ser interpretada semanticamente: se MS, , se algum MS in- 
termediário específico (e.g. aquele correspondente à sentença nuclear), 
se MS, se todos os MSs conjuntamente, etc. Disso dependia saber se 
transformações afetam ou não o significado básico extraível a partir de 
MS,“ Especialmente Chomsky (1955a: cap IX,X) e Katz & Postal (1964) 
elaboram o conceito de Marcador Transformacional (=MT), que seria 
um construto complexo obtido a partir de todos os MSs e das transfor- 
mações envolvidas na geração de uma sentença completa. Em última 
instância, o que a sintaxe gera fortemente é um MT: a descrição estrutu- 
ral completa de uma sentença. 

A natureza formal exata dos MTs tem muitos detalhes sutis que não 
cabem nesta introdução (logo, não redutível ao diagrama em (60)). Em 
Chomsky (1965: 130-136; 1966b: 52-56) encontram-se apresentações sim- 
plificadas de MT, já formuladas no então recém-proposto modelo sem 
transformações generalizadas, e com a interpretação semântica toda feita 
a partir do MS,, equacionado à Estrutura Profunda, partindo-se da as- 
sunção de Katz & Postal (1964) de que transformações afetam a inter- 


63, Dadas as premissas assumidas na época, parecia claro à primeira vista que certas trans- 
formações não afetaria o significado (e.g. T, ...«.; Gru adotou Agnes > Agnes foi ado- 
tada por Gru) e outras sim (e.g. T qui Gru adotou alguém > Quem Gru adotou?). 

Uma inspeção mais minuciosa revela que nada disso é óbvio. Amparados por argumentos, 
Katz & Postal (1964) fizeram uma aposta, que Chomsky (1965) levou adiante, e que viria a 
ser questionada depois pelos proponentes da Semântica Gerativa, com contra-argumentos 
que motivaram novas mudanças na GGT, como veremos em $4.3. 
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pretação semântica apenas na medida em que inter-relacionam de modo 
fixo MSs independentemente interpretáveis. Durante aproximadamente 
as três décadas seguintes, essa foi a visão hegemônica na GGT*!, 


853.6. ESTRUTURA SINTAGMÁTICA - PARTE Il (RAMIFICAÇÕES) 


Voltemos às estruturas sintagmáticas, retomando a história de onde a 
interrompemos para tratarmos de transformações, ou seja: os MSRs de 
Lasnik & Kupin (1977). Antes, porém, é preciso retroceder até Chomsky 
(1965) para introduzir um importante detalhe que havia sido omitido. 
Considere a estrutura em (61) e os dados em (62). 


(61) s (62a) As mães vão amamentar os bebês. 
SN Aux SV (62b) * A mãe vão amamentar os bebês. 
/N E da (62c)?* As mães vão amamentar os livros. 
D MW SN (62d)?* Os mistérios vão publicar os bebés. 
DN (62e) *As mães vão trovejar os bebês. 


Considerando apenas as categorias morfológicas, todas as sequências 
terminais em (62) “se encaixariam” perfeitamente na sequência pré-terminal 
D'NºAux"V'D'N de (61). Na prática, apenas o dado (62a) é incontestável. 
No outro extremo, (62b) é incontestavelmente malformado, porque o auxi- 
liar e o sujeito não concordam em número. Como a teoria prevê a impossi- 
bilidade de geração de (62b)? Até aqui, eu assumia tacitamente a aplicação 
de alguma versão da 'regra de concordância" definida em Chomsky (1957: 
39, 112) em termos transformacionais. Ou seja, a regra de inserção lexical 
que reescreve Aux não é sintagmática, porque não é alheia ao contexto es- 
trutural no qual Aux ocorre. Os traços de número e pessoa do SN imedia- 


64. Lemle (1984: 7-36) explica em mais detalhe o impacto da visão de Katz & Postal (1964) 
na concepção da Teoria Padrão (Estendida) sobre as transformações e sua (não) relação 
com o significado. 
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tamente anterior a Aux determinam a morfologia exata de Aux. Logo, isso 


|º. As estranhezas em (62c), 


se daria no subcomponente transformacional 
(62d) e (62e) parecem ser de outra natureza, mais relacionadas a “incom- 
patibilidade semântica"; e já foram abordadas no $2.1. É importante notar 
que, nas análises anteriores de Chomsky (1965), dados assim eram geráveis 
pelo subcomponente sintagmático, o que poderia ser encarado como um 
problema de sobregeração, ou como uma consequência não problemática, 
ficando a cargo do componente semântico legitimar ou não tais combina- 
ções estranhas. 

A inovação de Chomsky (1961a, 1962a, 1962b, 1965: cap 2) - elaborada 
em Chomsky (1970b) — foi reconceber todas as regras de inserção lexical 
como transformações locais. Assim, a capacidade gerativa fraca das re- 
gras sintagmáticas só iria até o ponto das sequências pré-terminais, como 
D'N'Aux"VºD'N. Sequências terminais decorreriam de inserções lexicais, 
definidas como em (63), que se lê: “V se reescreve como amament- no 
contexto em que V é imediatamente seguido por um SN do tipo [+anima- 
do,+mamífero,-adulto], e precedido por um SN do tipo [+animado,+mamife- 
ro;+adulto,+fémea]” (cf. Chomsky 1965: 107 [regra (xix)]). 


(63) V 5 amament- | SN Aux” "SN 


raid id ca, q — ObN animado, + mamifero,-adulto] 
Nesse modelo, portanto, o subcomponente de base, que constrói a Estrutu- 
ra Profunda, não é totalmente sintagmático, já que inserções de ILs seriam 
transformações. Outra característica importante é o fato de os símbolos 
não terminais serem reconcebidos como entidades mais complexas, que 
codificam características em termos de traços binários, tal como na fono- 


65. A mesma questão se coloca para a concordância entre D e N dentro do SN, da qual não 
trato aqui (cf. Chomsky (1957:29,n.3) para um primeiro esboço, ainda numa tentativa de 
solução por meios sintagmáticos). 
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logia de Jakobson et al. (1952), desenvolvida posteriormente em Chomsky 
& Halle (1968). 

Dados desviantes como (62c), (62d) e (62e) eram tratados por Chomsky 
(1965, cap 2) em termos de agramaticalidade parcial, conforme o grau de 
desvio entre o IL inserido e o contexto local especificado. Apesar de suas 
virtudes na cobertura empírica (não geração de estruturas agramaticais, e 
previsão de que a “estranheza semântica se apresenta em tipos e magnitu- 
des diferentes), tal sistema se mostrou um tanto redundante. Cada IL co- 
dificava em si uma porção considerável de informação também codificada 
nas regras sintagmáticas. Por exemplo, as regras sintagmáticas'SV>V'SN” 
e'SSN'Aux'SV) juntas, especificam que V deve ficar “entre um SN sujei- 
to e um SN objeto”; enquanto a regra em (63) especifica que amament- é 
um V, e que ele demanda a presença de um SN sujeito e um SN objeto, 
antes e depois dele, respectivamente. A redundância é ainda maior se levar- 
mos em conta que, em Chomsky (1965, cap 2), os elementos pré-terminais 
não são exatamente como nas duas regras esboçadas acima (e.g. V), mas 
sim complexos feixes de traços — e.g. [+V, +transitivo, +sujeito humano, +objeto 
humano], cf. Chomsky (1965: 90) — tal como temos em (63). 

A detecção e abordagem desse problema foi quase imediata. No clás- 
sico Remarks on nominalization, cujo manuscrito data de 1967, Chomsky 
(1970a) inicia a eliminação dessas redundâncias diagnosticando aspectos 
importantes dos sintagmas e do léxico. Primeiramente há um paralelo cla- 
ro entre estruturas de tipos categoriais distintos quanto às suas “demandas 
semânticas": e.g. a destruição da cidade pelos inimigos (SN), e Os inimigos 
destruíram a cidade (S), sugerindo, nesse caso, que o nome destruição e 
o verbo destruir são, num nível mais abstrato, 'a mesma coisa” e que se 
manifestam sintaticamente de modos diferentes (e.g. presença/ausência da 


preposição, morfologia e ordens não totalmente idênticas), porém com- 
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partilhando um “esqueleto estrutural bem semelhante“, Outro ingrediente 
importantíssimo dessa guinada teórico-analítica (cuja semente estava 
em Chomsky (1970a), mas cujos frutos mais robustos se encontram em 
Stowell (1981)) advém da iniciativa de unificar o tratamento das estru- 
turas sintagmáticas dos diferentes tipos de sintagma (SN, SV, SA, SP, ...) 
conforme o grau considerável de isomorfia observável entre eles quanto à 
ordem canônica de núcleos e complementos, bem como de 'especificado- 
res, Considere (64). 


(64a) Nós adoramos cinema. (64b) nossa adoração [por cinema] 
(64c) totalmente sem dinheiro. (64d) muito orgulhosa [do filho] 


Em todos os casos, o elemento sublinhado é o núcleo do sintagma em 
questão (SV, SN, SP e SA, respectivamente), o elemento à sua direita é seu 
complemento, e o elemento à sua esquerda é seu “especificador”. Embora 
essa descrição simplificada levante dúvidas — e.g. (64a) não seria uma S%; 
o que é especificador?; e por que ele parece mais essencial em (64a) e mais 
acessório nos demais exemplos? — ela já deixa claro que há algo em comum 
entre os tipos de sintagma. Primeiramente, todos eles aparentam ter um e 
apenas um núcleo, cuja identidade categorial (verbal, nominal, adjetival, 
etc.) coincide com a do sintagma como um todo. Ou seja, sintagmas são 
endocêntricos. Em segundo lugar, há uma ordem canônica fixa para o nú- 
cleo, seu complemento e seu especificador, que independe não apenas do IL 
particular, mas também do tipo de sintagma em questão”, Em (64), todos 
os complementos se seguem ao núcleo, por exemplo. Juntas, essas genera- 
lizações, sugerem fortemente que o componente sintagmático consiste no 
esquema básico em (65), independente da categoria. 


66. Isso já havia sido abordado antes sob várias formas (cf. Chomsky 1955a: 457-474; 1964: 
; Katz & Postal 1964: 120-148), porém é em Chomsky (1970a) que o 
fesqueleto estrutural! e as “demandas semânticas dos IL passam a ser reconcebidas como 
mecanismos gramaticais genuinamente separados. 


67. Veremos em $5.7 como a teoria acomoda casos de línguas com ordem 'complemen- 
to"núcleo' uniforme. 
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(65) la] X9X(YP); [b] XPHZP/X; [e] ns fd [d] X2KX 
WP'XP 


A partir daqui, uso as siglas em inglês para você se familiarizar com a 
praxe da bibliografia da GGT que venha a consultar. 'P”significa phrase, que 
é sinônimo de sintagma. Logo, VP (verb phrase) equivale a SV (sintagma 
verbal). O resto é autoexplicativo. O esquema em (65) constitui a Teoria 
X-Barra, uma concepção específica do subcomponente sintagmático que 
conta com muitas versões na GGT. As origens de sua versão canônica re- 
montam a Chomsky (1970a), Lasnik & Kupin (1977) e Stowell (1981). 
Por ora, deixemos de lado as regras (c) e (d), atendo-nos a (a) e (b). Note 
que essas não são regras de reescritura como as de antes, mas metarregras, 
fórmulas gerais aplicáveis a quaisquer categorias. Ou seja, X, Y e Z são va- 
). Além 
disso, a endocentricidade está codificada no esquema e prevista como ca- 
racterística inerente de todo e qualquer sintagma. Se há um V, há um VP e 


riáveis que podem corresponder a quaisquer categorias (V, N, A, 


vice versa; se há um A, há um AP e vice-versa; etc. Antes da Teoria X-Barra, 
essa generalização básica não era verdadeiramente capturada”. Nada, além 
de simples coincidência) impedia que houvesse uma regra não endocêntri- 
ca como 'VP5A'PP; por exemplo. 

A ordem “núcleo"complemento” está codificada em (65a) como uma 
propriedade sintática geral, independente de categoria. Note que (65a) es- 
tabelece a existência de uma unidade intermediária X' (leia-se: “X-Barra”) 
menor que o sintagma e maior que o IL, Logo, em todo VP há um V? em 
todo AP há um A, etc. Os parênteses em torno de YP indicam que a presença 
ou ausência do complemento depende da natureza transitiva ou intransitiva 


68. Para versões menos canônicas do esquema X-Barra, cf. Jackendoff (1977), Speas (1990), 
e Kayne (1994). 

69. Aliás, ao longo de todo o período pré-X-Barra, regras semiendocêntricas ou não endo- 
cêntricas foram ocasionalmente propostas em casos especiais, como nominalizações (e.g. 
NPnomAVP, em que nom é um morfema nominalizador) ou subordinação sentencial 
(eg. NP5S). 
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do IL que instancia o núcleo X. Note que, conforme (65a), só pode haver um 
complemento (cf. n. 20), que é sempre um sintagma completo, um YP, não 
um Yº ou um Y. A ordem 'especificador" núcleo” está codificada em (65b), 
que não combina ZP e X diretamente, mas sim ZP e X, seguindo-se daí a 
ordem em questão. Está previsto que só pode haver um especificador, e que 
ele deve ser um sintagma completo. 

Nesse sistema, todos os símbolos não terminais são organizações não 
atômicas de propriedades; diferentemente do sistema de Chomsky (1965) 
em que isso valia apenas para os elementos pré-terminais. Nas versões an- 
teriores da GGT, VP era um símbolo atômico, não analisável em Verb e 
Phrase. No esquema X-Barra, VP, Vº e V são respectivamente abreviações 
para <[+v,-n),2>, <[+v,-n],1> e <[+v,-n],0>. A parte [+v,-n] indica que 
tais unidades são da categoria verbal. O índice numérico indica o “nível 
de projeção" do elemento pré-terminal (0 = núcleo ou projeção mínima; 
1 = projeção intermediária; 2 = projeção máxima ou sintagma). Apesar 
da coincidência de caracteres, não se deve confundir [+v] com V, nem 
[+n] com N. Os traços [+v] e [+n] são unidades mais elementares a par- 
tir das quais categorias são formadas. Chomsky (1970a) propôs que V = 
[+y-n], N = [-v+n),A = [+v+n] e P = [-v,-n]”. Algumas generalizações 
transcategoriais podem ser capturadas assim. Por exemplo, só categorias 
[-n] podem licenciar a propriedade de caso a seus complementos, o que 
explica a ausência da preposição em Os inimigos destruíram a cidade, e a 


sua presença em a destruição da cidade pelos inimigos (cf. Vergnaud 1977; 
Chomsky 1986a: 186-204; Lasnik 2008). 
Saliento que as metarregras do esquema em (65) não são regras de 


reescritura que se aplicam a sequências geradas uma à uma num processo 


70. Como já mencionado (cf. n. 28), neste modelo adjetivos e advérbios seriam a mesma 
categoria [+v,+n]. 
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derivacional. A Teoria X-Barra é uma concepção puramente representa- 
cional de estrutura sintagmática. As metarregras são preceitos declarati- 
vos que estabelecem se cada arranjo hierárquico é ou não é bem-formado 
sintaticamente”!. Em suma, qualquer que seja a identidade categorial de 
X, todo X é imediatamente dominado por um X”; todo Xº domina ime- 
diatamente um X; todo Xº é imediatamente dominado por um XP; todo 
XP domina imediatamente um X'; todo Xº pode dominar imediatamente 
um (e apenas um) YP disposto logo após X; todo XP pode dominar ime- 
diatamente um (e apenas um ZP) disposto logo antes de X'?, Conforme 
as propostas canônicas da Teoria X-Barra (cf. Stowell 1981; Chomsky 
1981a), essas diretrizes gerais aqui apresentadas de modo simplificado 
estariam baseadas no formalismo matemático preciso de Lasnik & Ku- 
pin (1977). Ou seja, embora, na prática, as análises conduzidas com base 
na Teoria X-Barra sejam apresentadas majoritariamente em termos de 
diagramas arbóreos, por conveniência notacional, o fato é que todo o 
raciocínio pressupõe a existência de MSRs, que são conjuntos de mo- 
nossequências, nas quais os elementos não terminais são símbolos não 
atômicos, e a partir das quais são definidas as relações de constituência 
fundamentais, como dominância e seus derivados (irmandade, materni- 
dade, c-comando, etc.). 

Por fim, uma das mais importantes características da Teoria X-Barra é 
o fato de ela, ao eliminar por completo as coleções de regras de reescritu- 
ra particulares de cada língua, eliminar também aquela redundância entre 
léxico e sintaxe que fora detectada no sistema de Chomsky (1965). Cada 
IL codifica em si suas demandas, como, por exemplo, ter ou não um com- 


71. Isto não significa que toda a gramática seja não derivacional, tampouco não trans- 
formacional. Conforme essa versão da GGT (Chomsky 1991a, 19864), o subcomponente 
transformacional seria um sistema derivacional. 

72. Diz-se que à: domina imediatamente f se e somente (i) ct domina f3, e (ii) não existe um 
Y tal que ct domina y e y domina .. Se ar domina imediatamente f e 8 (8 = 3), diz-se que o. 
é mãe de f3e de 8, e que e 8 são irmãos. 
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plemento, qual a categoria desse complemento, e seus traços semânticos. 
A sintaxe é cega em relação a isso, e fornece apenas o esqueleto estrutural” 
no qual cada IL se “projeta. Nesse sentido, a estrutura sintagmática seria 
uma “projeção do léxico! Ao mesmo tempo, a sintaxe restringe fortemente 
o que seriam os ILs possíveis. Dados os limites do “esqueleto; somente po- 
dem “participar” de uma estrutura sintagmática os ILs que não demandam 
“geometrias” não previstas sintaticamente (e.g. sintagmas sem núcleo ou 
com múltiplos núcleos, ou com múltiplos complementos irmãos, etc.). Os 
diagramas abaixo sumarizam o que vimos até aqui. 


(66a) VP (66b) NP (66c) AP (66d) PP 
qd MN MN, AS 
aaa v Nº RE x a, p” 
as, E ai Pi Pd 
V N A o Pp 
execut- destruição capaz de 


Com o desenvolvimento dessas e de outras ideias que culminaram no 
modelo P&P, a concepção de estrutura sintagmática caminhou na direção 
de uma uniformização ainda maior, com a adição de categoriais funcionais, 
entre as quais as mais consensuais são 1 (flexão), C (complementizador) e D 
(determinante). A rigor, tais categorias sempre existiram na GGT. A novida- 
de foi reconcebê-las em termos do esquema X-Barra, como discuto a seguir. 

Do muito que se pode dizer sobre sintagmas determinantes (DPs), limi- 
to-me ao básico. Após os trabalhos pioneiros de Szabolcsi (1983) e Abney 
(1987), inter alia, tornou-se hegemônica na GGT a visão de que Ds não 
ocupam posição dentro do NP. Ao contrário, NPs são complementos de Ds, 
que se projetam até o nível DP, em conformidade com o esquema X-Barra. 
Para além desse argumento da uniformidade, há vários outros, baseados 
em padrões empiricamente atestados. Por exemplo, comparemos as duas 
paráfrases em (67) para “um carro antigo adquirido recentemente” (cf. dis- 
cussão em torno de (21) acima). 


(67a) DP (67b) DP 


D' D 
a Ed 
D NP D NP 
um MN um 4H. 
AP NP NP AP 
| 2 Ei: | 
A NP AP NP AP A 
[ | | [ 
AN x Nº NA 
novo | ] | | novo 
N A N A 
carro — velho carro velho 


Como já discutido, a relação de escopo de um AP (novo) sobre o outro (ve- 
lho), aliada ao caráter ilimitado da múltipla adjunção, sugere fortemente 
uma estrutura com recursivas camadas de NP, nas quais cada AP se encai- 
xa. (67a) e (67b) se equivalem hierarquicamente, diferindo linearmente, o 
que evidencia que o ordenamento de adjuntos é mais flexível, embora não 
totalmente livre (cf. “a bola vermelha e *a vermelha bola), sendo deter- 


minada por uma complexidade de fatores, corroborando a hipótese de 
que a metarregra de adjunção de sintagmas a sintagmas é tal como (65c) 
acima. Logo, D não pode ser um especificador de NP, senão teríamos em 
(67a) a ordem *novo um carro velho ou ainda *novo velho um carro. Se 
D fosse um adjunto a NP, não se teria como barrar a geração dessas duas 
últimas ordens, bem como de *novo carro velho um, ou *carro velho novo 
um, por exemplo. 

Para entender o sintagma flexional (IP), tomemos como ponto de par- 
tida a estrutura de S tal como concebida no sistema de Chomsky (1965), 
conforme (61) acima, em que S seria não endocêntrico. Uma reconcepção 
de S em termos do esquema X-Barra toma Aux (renomeado como I(in- 
flection)) como o núcleo da estrutura, que projeta um [" e um IP. Pois é, o 
morfema de flexão verbal (i.e. tempo e concordância), ora realizado como 
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uma “palavra independente; ora como um afixo verbal, seria o núcleo da 
sentença. À posição hegemônica nesse modelo é que a posição de especifi- 
cador de IP não é preenchida na Estrutura Profunda, mas acaba abrigan- 
do o DP sujeito ao longo da geração da sentença, já no subcomponente 
transformacional, pelo movimento do sujeito que teria sido gerado como 
especificador de VP, conforme a hipótese do sujeito interno ao VP (cf. 
Koopman & Sportiche 1991). Para ilustrar esse argumento, valho-me 
de uma adaptação de um exemplo de George Lakoff (cf. Mendoza 
Ibániez 1997: 35-36), originalmente usado como contra-argumento à visão 
chomskyana de gramática nas décadas de 1960 e 1970, e que, ironicamente, 
acaba se tornando um argumento a favor da visão chosmkyana preva- 
lente nas décadas de 1980 e 1990. 


(68) A Alemanha derrotou o Brasil de goleada em 2014. Isso não vai acontecer em 2018. 


(68) é um minidiscurso composto de duas sentenças. Analisaremos a 
primeira a partir da segunda. A que o pronome isso remete? Grosso modo, 
ao evento de derrota imposto pela Alemanha ao Brasil. Ou seria, mais espe- 
cificamente, à derrota do Brasil para a Alemanha de goleada? Na verdade, as 
duas possibilidades estão disponíveis; e parece que a segunda interpretação 
é mais saliente. Importa aqui que o adjunto de goleada pode ou não fazer 
parte do conteúdo 'retomado' por isso. Importa também que tal conteúdo 
retomado deve necessariamente remeter a uma derrota imposta pela Ale- 
manha ao Brasil; não a uma derrota qualquer, nem uma derrota imposta ao 
Brasil por qualquer outro vencedor, nem uma derrota imposta pela Alema- 
nha a qualquer outro vencido. Ou seja, sujeito, verbo e objeto estão neces- 
sariamente inclusos na unidade retomada. Por fim, note que essa retomada 
pronominal não recupera a informação de tempo passado da primeira sen- 
tença. Descritivamente falando, é como se o que fosse retomado fosse um 
VP de cujo núcleo V tivesse sido subtraída a morfologia de tempo. Mas 
esse VP deveria incluir em si o sujeito! Como todas essas generalizações 
podem fazer sentido ao mesmo tempo? Observe (69). 
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(69) p estrutura profunda (69b) IP estrutura superficial 
ET, 


DP, 


(a 
PÉ Re dim -ou a 


ve a a a Alemanha E 
A V DP de goleada t Pio ES 


a Alemanha — derrot- [Ss DP de goleada 


t 
o Brasil ES 


o Brasil 


A estrutura profunda em (69a) não é como nas versões anteriores da 
GGT no que concerne à posição em que o sujeito é gerado, i.e. no espe- 
cificador de VP. Essa assunção, juntamente com a de que o pronome isso 
da sentença seguinte retoma um VP, assegura que a informação retomada 
contém necessariamente o sujeito, o verbo e o objeto. A opcionalidade 
de isso incluir ou não a informação de goleada na retomada vem do 
fato de haver dois VPs na estrutura de adjunção, podendo o menor ou o 
maior ser retomado. Além disso, em (69a), o verbo não contém em si a 
flexão de tempo (e concordância), a qual é gerada como o núcleo do IP 
que toma o VP como complemento, o que explica por que a retomada 
pronominal não inclui tal informação se a unidade a ser retomada é o VP 
da estrutura profunda. 

O VP codifica um evento (ou estado) não instanciado no tempo; e o 
núcleo do IP codifica em si um tempo de referência no qual o evento ex- 
presso pelo VP ocorre. Por mapear um evento no tempo, o IP seria uma 
proposição acerca do evento: algo que pode ser avaliado como verdadeiro 
ou falso, e portanto assertado, questionado, etc. A separação entre V e Ina 
estrutura profunda é, como já vimos, herança dos primórdios da GGT. A 
união morfológica entre V e I se dá no subcomponente transformacional, 


pelo movimento de V para 1, como em (69b), em que também o sujeito se 
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moveu para o especificador de IP. As motivações para tais movimentos são 
um tema complexo ora simplificado. Consideremos que a natureza afixal 
de I “puxa! V para si; o que não acontece se 1 for um auxiliar morfologica- 
mente autônomo, como em (70). O fato de vai preceder imediatamente o 
VP corrobora a hipótese de que se trata de um núcleo de IP cujo comple- 
mento é o VP, em obediência à metarregra (65a). 


(70) O Brasil vai derrotar a Alemanha em 2018. 


Contudo, em (70), assim como em (69b), o sujeito já não mais está em VP. 
Seu deslocamento para o especificador de IP é o que possibilita a concor- 
dância entre o sujeito e I (seja 1 morfologicamente autônomo ou afixal), 
numa relação local do tipo especificador-núcleo. 

Assim como as camadas VP e IP são os correlatos sintáticos do even- 
to e da proposição, respectivamente, haveria a camada CP, correspondente 
ao enunciado. O núcleo C codificaria a força ilocucionária, tomando seu 
complemento IP como o conteúdo cuja verdade está sendo assertada (sen- 
tença afirmativa), questionada (sentença interrogativa), etc., a depender do 
subtipo de C presente na estrutura. Em orações subordinadas, é mais co- 
mum que C porte material morfofonológico (e.g. que ou se). O fato de tais 
ILs precederem imediatamente o IP evidencia que se trata de núcleos que 
tomam o IP como complemento, conforme a metarregra (65a) prevista 
pelo esquema X-Barra. A posição de especificador de CP seria dedicada a 
sintagmas de algum modo 'enfatizados, seja por topicalização (informação 
velha) ou focalização (informação nova). Sintagmas interrogativos (com 
morfologia QU) são um subtipo de foco, codificam a informação nova que 
se quer saber, a subparte do conteúdo proposicional de IP que não é pres- 
suposta. Por isso tal posição é o 'ponto de chegada” dos elementos-QU no 


final da derivação. Confira o par em (71). 
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(7la) CP estrutura superficial (71b) cr estrutura superficial 


| RN 
E: e 
Sa AP Sa 
Cri JP IP 
DP P > 
A 
/N, Eds A 
1 vP 
mu wi ZN ” Gru vi MN 
DP V DÊ v 
E da? tt AN 
V DP ) v D p 
adotar /N adotar t, 
Agnes 
asserção de que é verdade que Gru pressuposição de que é verdade que Gru adotará 
adotará Agnes alguém e que tal conhecimento é compartilhado 


com o interlocutor; e solicitação da informação 
sobre a identidade da pessoa a ser adotada 


A partir de meados da década de 1990, com o advento do PM, a Teoria 
X-Barra passa por reformulações e já conta com diversas revisões. O que 
apresento aqui tem por base a reformulação de Chomsky (1995a: cap 4) e 
inovações de Hornstein (2009). Sob tal ótica, o componente sintagmático 
volta a ser concebido em termos derivacionais. As características básicas 
do esquema X-Barra (i.e. endocentricidade, binariedade, uniformidade, 
etc.) são tidas como decorrentes da mecânica derivacional, cuja operação 
básica de construção de estrutura sintagmática é Conectar”, responsável 
por combinar itens lexicais formando sintagmas, recursivamente combi- 


73.0 termo original em inglés para essa operação é Merge, cuja tradução literal seria 'fun- 
dir, Em Guimarães (1998), traduzi-o como Conectar, Uns tantos linguistas brasileiros ado- 
taram essa terminologia, mas a maioria adota outras nomenclaturas. A mais comum é 
Concatenar, Lamento essa má escolha terminológica, que remonta ao influente texto de 
Epstein (1999) — difundido como manuscrito em 1995 — em que o autor, escrevendo em 
inglês, refere-se a Merge com o nome de Concatenate. Como já apontei acima (cf. n. 39), 
o termo Concatenar (crucial nas fases iniciais da GGT, mas não aplicável à teoria sintag- 
mática hegemônica do PM) é consagrado na matemática para descrever uma operação 
associativa, coisa que Merge não é. 
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náveis em sintagmas maiores, constituindo-se assim numa versão mais 
“enxuta” da antiga Teoria X-Barra: a Estrutura Sintagmática Pura (ESP; em 
inglês, Bare Phrase Structure). Conectar toma dois constituintes sintáticos 
independentes (atômicos ou complexos) x & y, e, da combinação entre 
eles, gera o sintagma [* x y ]. Cada conexão forma um novo objeto mate- 
mático quase tão simples quanto um mero conjunto formado pelos dois 
objetos sintáticos combinados”, exceto quanto ao fato de tal conjunto re- 
cém-formado ter atribuído a si um rótulo categorial, herdado de um de 
seus membros”. É isso que indica o x sobrescrito junto ao colchete de 
abertura em [* xy ]. Ou seja, o constituinte formado pela conexão entre 
x e y é do mesmo tipo categorial de x'º. No início da derivação, as unida- 
des sintáticas disponíveis para combinação são ILs. Desses “átomos” vão 
sendo formadas unidades mais complexas, que herdam suas identidades 
categoriais de suas partes imediatas. Contrariamente às versões pré-TRL, 
o fluxo derivacional na ESP se dá das partes para o todo, similarmente ao 
que fora proposto nos modelos não transformacionais da Gramática Ca- 
tegorial iniciados aproximadamente duas décadas antes da GGT. Façamos 
a pergunta minimalista relevante. Ainda que a existência de estrutura sin- 
tagmática (algo como X-Barra) seja empiricamente justificada, o que faria 
dela conceptualmente necessária (em oposição a meras sequências de ILs, 
sem relações de parte e todo)? 


74. Assim sendo, posto que a relação de pertencimento a um conjunto não implica ne- 
nhum tipo de ordem (i.e. [x, y| = [y, x)), então, contrariamente à tradição da GGT tão 
contundentemente defendida em Chomsky (1965: 123-127), a estrutura sintagmática não 
codificaria relações de precedência temporal entre os constituintes. 

75. Na versão original da ESP (Chomsky 1995a: cap 4), à conexão entre x e y não gera 
simplesmente [x, y), mas o objeto matemático (também definível em termos de teoria de 
conjuntos) mais complexo (x, [x, y)|, no qual se codifica uma assimetria entre os dois ele- 
mentos combinados, o que determina qual deles se projeta. 

76. Poderia, inversamente, ser do mesmo tipo de y, mas jamais de um terceiro tipo z dis- 
tinto de x e de y, nem poderia não ter tipo categorial. É assim que esse sistema codifica o 
princípio da endocentricidade de sintagmas. 
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Para Hornstein (2009), Conectar é, a rigor, resultado da interação entre 
as operações Combinar e Rotular. Combinar agrupa quaisquer dois elemen- 
tos gramaticais com rótulo categorial, formando um “bloco” que os contém, 
e que pode, recursivamente, ser agrupado para formar blocos maiores. Ro- 
tular, por sua vez, opera em cima do produto imediato de Combinar, e toma 
aquele bloco recém-formado como um todo, analisa-o em suas partes ime- 
diatas, e atribui-lhe um rótulo, conferindo-lhe o mesmo estatuto categorial 
de uma das partes que o compõem, convertendo o bloco" num sintagma, de 
caráter endocêntrico. É graças à rotulação que um bloco/sintagma passa a 
ser conectável a outros. O sistema só conecta ILs (todos rotulados a prio- 
ri), e Rotular converte uma combinação complexa num “L derivado. Por 
exemplo, dado o verbo beb-,, que é um predicador de dois lugares, e o argu- 
mento chá, , forma-se o bloco [beb-, chá, |, que, após rotulado, torna-se 
[“ beb-, chá,), que é um predicador de um lugar (assim como dorm-,), 


que pode se combinar ao argumento Alice,, formando o bloco [Alice,, 


Mm 
[, beb-, chá,]], que, rotulado, torna-se [“ Alice, [, beb-, chá, ]], equiva- 
lente a um verbo a-argumental, um predicado monádico (e.g. chov-,). 
Nessa concepção minimalista de estrutura sintagmática, Combinar não 
seria uma operação exclusiva da gramática; é parte do aparato cognitivo 
geral, fruto da capacidade de agrupar quaisquer elementos (representações 
mentais) formando um “bloco” que as contém, tal que esse bloco pode, re- 
cursivamente, ser agrupado para formar blocos maiores. Assim, uma parte 
da superoperação Conectar é conceptualmente necessária de modo trivial, 
porque deriva de fatores cognitivos externos à gramática”. A própria com- 
posicionalidade semântica (cf. $4.4) depende de relações parte e todo entre 
agrupamentos de itens lexicais. Se ela for entendida como uma demanda 
do sistema que interpreta a estrutura sintática, a presença de algo como 


77. Por que, na sintaxe, Combinar se restringe a dois termos? Sobre essa questão complexa, 
por ora apenas sugiro que restringir Combinar a dois elementos reduz a um mínimo a 
complexidade computacional da busca pelo rótulo do todo feita a partir da inspeção das 
propriedades das partes combinadas (cf. Chomsky 2013). 
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Combinar na gramática é inescapável. Rotular seria uma operação exclu- 
sivamente gramatical, responsável por converter “blocos” em “sintagmas, 
conferindo-lhes um caráter endocêntrico, de modo que a complexidade 
computacional de cada passo é sempre a mesma, e a menor possível, pois o 
sistema está sempre a combinar átomos, cuja estrutura interna fora 'esque- 
cida” por efeito da compilação/atomização resultante da rotulagem. Essa 
concepção fatorada de Conectar reduz o estritamente linguístico a um mi- 
nimo, oferecendo uma alternativa plausível do ponto de vista da adequação 
para além do nível explicativo, nos termos esboçados em $2.6. 

Quanto à ordem linear entre os ILs, ela seria imposta pela natureza do 
sistema articulatório-perceptual que faz interface com a sintaxe, pois a fala 
se instancia na linearidade do tempo real. Na impossibilidade de pronun- 
ciar múltiplos ILs simultaneamente, é preciso, de alguma forma, sequen- 
ciá-los no plano fonológico. Entretanto, isso não significa necessariamente 
que tal ordenamento deva estar codificado na sintaxe (cf. n. 74). Na maioria 
das versões do PM, a precedência linear é estabelecida fora da sintaxe, no 
mapeamento entre a sintaxe e a fonologia, como veremos adiante (cf. $4.3). 

Vejamos agora um exemplo de como se dá a derivação de estruturas 
sintagmáticas de acordo com a ESP, a partir do dado em (72), considerando 
apenas a sua subestrutura VP. 


(72) Quem, o jornalista vai criticar t? 


Primeiro, combinam-se criticar, e quem,, formando o bloco [criticar 


pr 
quem, ), satisfazendo assim a 'valência interna" do verbo. Segue-se a rotula- 
gem do bloco, gerando [“criticar, quem, |”. Em paralelo, combinam-se o, e 
jornalista, formando o bloco (o, jornalista, |, subsequentemente rotulado, 
gerando [? o, jornalista, ). Os resultados dessas combinações são então com- 


binados, e o bloco formado disso é subsequentemente rotulado, gerando (73). 


78. Note que uma rotulagem inversa impossibilitaria tratar o sintagma formado como um 
“predicador monoargumental a ser saturado pelo sujeito. 
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(73) v 


D v 
O aa 


o, jornalista, criticar, quem,, 


Esse diagrama dá impressão de que se perdeu a distinção entre projeções 
mínimas, intermediárias e máximas. Entretanto, isso está plenamente codi- 
ficado em (73). Na ESP, os “níveis de barra” são definidos relacionalmente e 
derivacionalmente. Projeções mínimas são constituintes da ordem de gran- 
deza de um IL, que não contêm nenhum constituinte sintático. Projeções 
máximas são unidades não contidas em outra de rótulo idêntico ao seu. 
Projeções intermediárias são unidades que não são projeções mínimas nem 
máximas”, Tomemos os três constituintes rotulados como V. O mais encai- 
xado é o IL criticar,, que já traz o rótulo do léxico”. O mais alto é projeção 
máxima de V (=VP). O do meio é sua projeção intermediária (=V”). O es- 
tatuto de uma projeção pode mudar ao longo da derivação. No ponto mais 
remoto em que ainda não fora conectado ao sujeito, o constituinte verbal 
["criticar, quem, ] é uma projeção máxima. Uma vez conectado ao sujeito, 
torna-se projeção intermediária (posto que seu nódulo-mãe também é um 
V). Duas observações se fazem pertinentes. [" o, jornalista, ) é uma proje- 
ção máxima (=DP) que não traz dentro de si uma projeção intermediária 
(=D), desnecessária nesse sistema, que não depende de uma metarregra 
XP>5(ZP)'Xº — na qual X' é obrigatório — para gerar um XP. Por fim, como 
definido acima, tanto jornalista, como quem, são, simultaneamente, pro- 
jeções mínimas e máximas (N=NP e D=DP). Isso é possível nesse sistema 
mais enxuto, com menos unidades, mas sem perda de informação estrutural 
relevante. Adiante, por razões expositivas, vou abreviar Combinar-&-Rotu- 
lar como Conectar, e usar a notação tradicional de níveis de barra. 


79.Cf. Chomsky (1995c). Esta visão relacional dos 'níveis de barra” remete à obra de Muys- 
ken (1982). 


80. Em ESP não há mais a distinção redundante entre nódulo terminal e pré-terminal. 
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853.7. ESTRUTURA TRANSFORMACIONAL - PARTE Il 
(RAMIFICAÇÕES) 


É chegada a hora de compreender o essencial das concepções mais re- 
centes de estrutura transformacional à luz dos avanços acerca de estrutura 
sintagmática vistos em $3,6. Nosso ponto de partida serão os pares decla- 
rativa/interrogativa do holandês em (74) e (75). 


(74a)  Hijrijdt de auto. (74b)  Rijdt hi de auto? 
ele dirige o carro dirige ele o carro 
“Ele dirige o carro? “Ele dirige o carro?” 

(75a)  Hij kan de auto rijden. (75b) Kan hij de auto rijden? 
ele pode o carro dirigir pode ele o carro dirigir 
“Ele pode dirigir o carro” “Ele pode dirigir o carro?” 


(75c)* Rijden hij kan de auto? 
dirigir ele pode o carro 


Excetuando-se a questão da ordem entre verbo e objeto (cf. Biberauer, 
Holmberg & Roberts 2014), note que declarativas e interrogativas exibem, 
respectivamente, as ordens sujeito-verbo e verbo-sujeito. Como visto em 
em $3,6, o núcleo de CP codifica a distinção asserção/interrogação. O fe- 
nômeno acima pode ser descrito como o movimento do elemento verbal 
mais próximo para CO dado (74b) parece simples, como se V se mo- 
vesse para C. A rigor, V se move para I, formando, via adjunção (cf. (65d)), 
o núcleo complexo [! V"I], o qual, por sua vez, se move para C. Logo, V 
apenas 'pega carona" no movimento de I para C. Os dados (75b) e (75c) 
evidenciam isso, pois o auxiliar kan ocupa a posição 1, não havendo razões 
morfológicas para se mover V para I. A demanda de C quanto a ter 'um 
elemento verbal” adjungido a si só pode ser satisfeita pelo movimento de I 
(cf. (75b)), não pelo movimento de V (cf. (75c)). 

O paradigma acima ilustra um fenômeno mais amplo da sintaxe das 
gramáticas em geral: a localidade dos movimentos de adjunção de núcleo 
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a núcleo, que já fora atestado e capturado na análise de Chomsky (1955a, 
1957) para a morfossintaxe verbal do inglês, pela transformação de salto 
do afixo, definida em termos locais, não havendo saltos envolvendo Afe v 
não adjacentes (cf. $3.5). Na passagem entre as décadas de 1980 e 1990, a 
visão predominante era que, conforme o esquema X-Barra, um núcleo H 
só pode ocupar sua posição original de projeção mínima de HP, ou estar 
adjungido a outro núcleo em conformidade com a metarregra (65d). Tal 
adjunção se obtém via movimento, em que os radicais se movem “para 
cima” em direção aos afixos. Tal movimento obedece a uma condição 
de localidade conhecida por Restrição de Movimento de Núcleo (RMN, 
cf. Travis 1984; Chomsky 1986b: 71; Baker 1988), que defino abaixo do 
modo mais conveniente para nossos objetivos: 


(76) | RMN:Um núcleo H só pode se adjungir ao núcleo J tal que HP é comple- 
mento de Jº. 


Em (77) temos uma estrutura mais abstrata que estaria por trás do dado 
(74b) acima, se tomarmos XP, YP e ZP como CP, IP e VP, respectivamente. 


(7a) XP (77b) XP (77) xP 
| 
4 x % 
Pai Pai ES 
XY X YP xXx YP 
Ps AS ZA 2a 
Kk  Y K  Y ÁXKP Y 
A, Ei Pd Ss 
Y ZP Y 2 ZY o ZP 
ES, Ds RE Se 
IP 2 ZYib Z Po 7 
Z wP [4] wP [TI WP 


81. Ou, inversamente, o núcleo ] só pode hospedar o núcleo H, tal que HP é complemento de. 


195 


Em (77a) teriamos a estrutura profunda. Em (77b), temos V (=Z) adjun- 
gido a 1 (=Y), em conformidade com a RMN. Em (77c), temos a adjunção 
local de I(=Y) a C(=X), na qual V'pega carona” A única posição à qual Z 
pode se adjundir é Y, o único elemento que Y pode “hospedar” é Z. Igual- 
mente, Y só pode se adjungir a X, e X só pode hospedar Y. Em termos 
lineares, existe, entre Y e Z, ao menos um outro núcleo: L, o qual, confor- 
me a RMN, não é elegível para interferir no movimento (nem Z pode se 
adjungir a L, nem L pode se adjungir a Y). Pela mesma lógica, o núcleo K 
que figura linearmente entre X e Y não interfere na localidade entre X e Y. 
A depender das demandas morfológicas de cada núcleo, não há nenhum 
movimento (cf. (75a)), ou há movimento de Z para Y apenas (cf. (74a)), 
ou de Y para X apenas (cf. (75b)), ou de Z para Y com subsequente movi- 
mento de Y para X, no qual um Y complexo se move carregando Z dentro 
desi (cf. (74b)). 

A eventual presença de potenciais interventores' que, na prática, não 
interferem no movimento de núcleo já havia sido notada por Chomsky 
(1955a: 443) em casos em que há advérbios que 'quebram” a adjacência en- 
tre Afe v, e mesmo assim o salto do afixo se dá, como se não houvesse o 
advérbio ali. É o que vemos em (78), em que o afixo -r (gerado junto a 
dev-) salta até gst- passando por cima de sempre”. 


(78) Alice devia sempre estar bebendo chá. 


Lasnik (2000: cap 3) mostra que dados como (78) são analisáveis através 
da mesma mecânica em (77), na qual X = dev-,Y = -r,Z = est-,e W = -ndo. 
O advérbio nesta análise seria o KP (mais precisamente, um adjunto), que 
não interfere no salto do afixo, conforme a RMN. 


82.A solução provisória de Chomsky (1955a: 43) resume-se, grosso modo, à regra 
Af(Adv)'v> (Adv Af'v. 
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Retomemos agora um padrão visto em $3.6, reconstruído como 
em (79). 


(793) | Akemi adorou os brinquedos . 
(79b) Quem, t adorou o qué ? (79) * O que, quem, adorou, ? 
(79d) Quem, t adorou os brinquedos, ? (790) O que, Akemi, adorou 1? 


Em (79) há, digamos, uma “disputa” entre dois sintagmas-QU (sujeito 
e objeto de adorou) para ocupar a posição de especificador de CP, locus 
do “foco da pergunta” Nessa disputa, quem ganha de o quê, pois, antes do 
movimento, quem está mais perto da posição de chegada do que o quê 
está. Chomsky (1973a) analisou esses padrões em termos da Condição de 
Superioridade, segundo a qual quem está numa posição hierarquicamente 
superior a o quê. Não se trata de proximidade em termos lineares. A relação 
crucial aqui é c-comando, que, para os nossos propósitos, pode ser definida 
como em (80)*'*. 


(80) at c-comanda $ se e somente se: (i) ot = B3; (ii) a não domina $; e (ii) 


tudo que domina a também domina . 


Parto dos mesmos diagramas em (77a) e (77b) para analisar os dados em 
(79). Considere que ador- se projetaria em V-V'-VP correspondendo a 
Z-Zº-ZP no diagrama, quem e o quê corresponderiam a LP e WP respec- 
tivamente. Y-Y'-YP e X-X-XP corresponderiam a I-['-IP e C-C'-CP res- 
pectivamente. (77a) seria a estrutura profunda de (79b). Em (77b), KP cor- 


83, Neste livro, assumo que nada domina a si próprio (cf. n. 46), o que torna necessária a 
condição em (80i). 

84. O c-comando é uma noção antiga (cf. Klima 1964; Langacker 1969; Reinhart 1976; 
Lasnik 1976). Ao longo do desenvolvimento da GGT, ele foi se mostrando mais e mais 
relevante, ao ponto de, na década de 1990, ter se tornado a noção mais central da teoria, 
relevante para o estabelecimento de quase todas as relações gramaticais. Isso levou Frank & 
Vijay-Shanker (2001) a redefinirem c-comando como a noção mais básica, a partir da qual 
as outras (dominância, maternidade, irmandade) são derivadas. 
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responde a quem e LP é seu vestígio. Note o movimento de V para I (Z para 
Y) que forma o verbo flexionado adorou. Este é o estágio imediatamente 
anterior ao movimento do sintagma-QU. Dada a Condição de Superiori- 
dade, quem tem prioridade sobre o quê porque ambos são c-comandados 
pelo núcleo atrator C (=X) e quem c-comanda o quê, dado que tudo o que 
domina o DP quem (=KP) — i.e. IP (=YP), C' (=X') e CP (=XP) — tam- 
bém domina o DP o qué (=WP), e não há relação de dominância entre os 
dois DPs distintos que disputam pela posição de especificador de CP (=XP). 
Inspecionando-se o diagrama, é fácil constatar que o inverso não é verda- 
deiro, i.e. o quê não c-comanda quem”. 

Na TRL, avanços significativos surgiram a partir da noção de Minimali- 
dade Relativizada (MR) de Rizzi (1990), que unificou diversos fenômenos 
distintos de localidade de movimento, como os dois que acabamos de ver, 
tomando-os como meras instanciações particulares do mesmo princípio. 
Todo movimento é regulado por MR, em que minimalidade se refere à dis- 
tância estrutural entre as posições de origem e de chegada do movimento, 
que deve ser a mínima possível; e ela é relativizada porque depende do tipo 
de elemento que está sendo movido (para satisfazer algum requerimen- 
to gramatical)*. A menor distância possível pode ser maior ou menor em 
cada caso específico, a depender de quantos e quais sejam os “concorrentes 
do mesmo tipo” presentes na estrutura, e que posições eles ocupam, o que 
impacta nas relações de c-comando. Elementos c-comandantes têm prefe- 
rência sobre elementos c-comandados; mas desde que se trate de elementos 
do mesmo tipo, caso contrário não há concorrência entre eles. É por isso 


85. Não há anomalia na estrutura final de (79c) quanto a requerimentos gramaticais de boa 
formação. Mas (79c) é agramatical por (79b) ser melhor quanto à economia derivacional, 
pois um movimento é mais custoso que outro. Há abordagens representacionais para tal 
contraste (e.g. Brody 1995: 24, 45, 69-75); mas a visão derivacional tem prevalecido, face a 
tipos mais intrincados de movimento (cf. Múller 1998; Guimarães 2003). 


86. O conceito de minimalidade remonta a Chomsky (1986b: 10), e por sua vez se baseia no 
conceito de regência, que também norteia a formulação original da MR. Nesta apresenta- 
ção adaptada, ponho de lado a regência. 
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que (79e) é tão gramatical quanto (79d), pois em ambos os casos só há um 
sintagma-QU, sem “concorrente do mesmo tipo; sendo automaticamente 
o mais próximo do alvo do movimento. Sintagmas-QU disputam apenas 
entre si, núcleos disputam apenas entre si, etc. A RMN definida provisoria- 
mente em (76) pode ser redefinida em termos de c-comando, unificando 
assim as análises”, 

A partir da MR e seus refinamentos e desdobramentos (em especial 
Lasnik & Saito (1992) e Chomsky (1995a: cap 3)), a concepção de transfor- 
mações de movimento foi drasticamente simplificada, com consequente 
aumento de poder explicativo. Alguma propriedade de um IL que é núcleo 
de um sintagma deflagra a necessidade de que um constituinte de algum 
tipo específico se mova para que haja uma relação sintática local entre os 
dois elementos envolvidos. O movimento sempre se dá de uma posição 
c-comandada para uma posição c-comandante; e é com base na mesma 
noção de c-comando que se dá o desempate em caso de disputas, tal que 
a MR fornece a métrica para se medir distâncias. Além disso, haveria res- 
trições de ilha (cf. $2.6, (24b)) e de subjacência (Chomsky 1986b, 2000b, 
2001, 2008), que estabelecem que certos domínios sintáticos são “intrans- 
poníveis. Esses poucos princípios compõem o submódulo Mova-c do 
componente transformacional. 

Além do movimento, o subcomponente transformacional conta ainda 
com um submódulo de Regras de Construção (do inglês, construal), res- 
ponsável por padrões relacionados à 'conexão semântica” entre sintagmas, 
incluindo elementos silenciosos. Essa parte do subcomponente transfor- 
macional é tradicionalmente concebida em termos representacionais”. 


87. L.e. Um núcleo H pode se adjungir a um núcleo J se e somente se; (i) J c-comanda H; (ii) 
não há nenhum núcleo G tal que J c-comanda G imediatamente (i.e. não existe nenhum 
núcleo c-comandado por ] que c-comande G), e tal que G seja dominado por um consti- 
tuinte que c-comanda mutuamente J. 


88. Para uma visão radicalmente derivacional dos mesmos fenômenos, cf. Hornstein (1999, 
2001, 2009), Hornstein & Polinsky (2010), Boeckx et al. (2010). 
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Basicamente, trata-se do estabelecimento de relação de correferência entre 
elementos distantes de uma mesma sentença, a partir das relações estrutu- 
rais que eles mantêm entre si por intermédio da estrutura como um todo. 
É importante ter isso em mente, porque muitos pensam que toda trans- 
formação pressupõe derivação, o que não é verdade. As regras de constru- 
ção são representacionais, declarações de boa formação (de SS ou LF) que 
legitimam ou não certas dependências de longa distância entre sintagmas 
de modo sensível ao contexto estrutural (logo, são transformações). Ilus- 
tro a seguir um dos fenômenos regulados por mecanismos de construção. 
Considere os dados em (81). 


(81a) Alice disse que ela bebeu chá. (81b) Ela disse que Alice bebeu chá. 
(81c) Alice disse que Alice bebeu chá. (81d) [A amiga dfela]] disse que Alice bebeu chá. 


Em (8la), os DPs Alice e ela podem ter o mesmo significado ou não, 
a depender do contexto pragmático. Isso parece banal, posto que ela, por 
sua própria natureza dêitica, 'pega emprestado” o significado de outro DP, 
dentro ou fora da mesma sentença. Em (81b), Alice e ela não podem ter o 
mesmo significado, mesmo que todas as circunstâncias pragmáticas cons- 
pirem para que tal interpretação seja a única plausível. Enfim, ela só pode 
remeter a outra mulher que não Alice. Essa outra mulher pode coinciden- 
temente também se chamar Alice; o que não muda o fato de a correferência 
ser impossível em (81b). Curiosamente, em (81c), as duas instâncias de 
Alice não podem ter o mesmo significado. Qualquer que seja o contexto, 
trata-se de duas mulheres distintas com o mesmo nome. Claramente, em- 
bora o fenômeno seja relacionado ao significado, o fator determinante não 
é semântico nem pragmático, nem puramente lexical. Nos mesmos con- 
textos em que a correferência é impossível em (81b) e (81c), ela é possível 
em (8la). (81c) é particularmente revelador, pois não há um DP dêitico; 
evidenciando que a impossibilidade de correferência em (81b) não se deve 
a uma restrição sobre ela, mas sim sobre Alice. Por fim, em (81d), temos 
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que Alice e ela podem ser correferentes ou não, mas Alice e a ami! 1 
não podem ser correferentes. 

Tudo isso (e mais) é explicado pela Teoria de Ligação (TL) — cf. Chomsky 
1980b, 1981a: cap 3, 1986a: 164-184; Chomsky & Lasnik 1993 — que ora apre- 
sento de modo informal e incompleto, mas suficiente para os objetivos 
presentes. A TL reconhece três tipos de DPs quanto às (im)possibilidades 
de correferência com outros DPs: (a) anáforas (e.g. se, si mesma); (b) pro- 
nomes (e.g. ela, eu); e (c) expressões referenciais (e.g. Alice, a amiga dela, 
etc.). Esses três tipos de DP estão sujeitos às regras de construção conheci- 
das por Princípio A, Princípio B e Princípio C, respectivamente. Muito sim- 
plificadamente, o Princípio C determina que um DP do tipo (c) não pode 
compartilhar seu índice referencial com nenhum DP que o c-comande (in- 
dependentemente do tipo do DP c-comandante)". 

Para verificar a aplicabilidade disso aos dados simples em (81) não é 
necessário nos apoiarmos em diagramas X-Barra mais detalhados. Utili- 
zando apenas os recursos sintagmáticos da Teoria Padrão, já se pode facil- 
mente atestar que em todos os exemplos em (81) o DP sujeito de bebeu é 


c-comandado pelo DP sujeito de disse. No primeiro caso, a correferência 
é possível porque o sujeito de bebeu não é do tipo que deve obedecer ao 
Princípio C. Nos três últimos, Alice não pode ser correferente ao sujeito 
de disse, mas é livre para ser correferente a qualquer DP fora da sentença, 
ou mesmo dentro da sentença, desde que não seja um DP c-comandante, 
como ela em (81d). 

Após essa breve e seletiva apresentação das características básicas do 
subcomponente transformacional da TRL, passo agora a uma exposição 
(também fragmentada e simplificada) de como essa concepção tem se de- 
senvolvido no âmbito do PM, em que há uma retomada parcial de uma 


89. Nessa concepção, o índice referencial (indicado por caracteres subscritos) de um DP 
seria um elemento morfossintático da sua estrutura, através do qual o componente inter- 
pretativo (que constrói o significado global da sentença a partir dos significados de suas 
partes) atrela ou não os significados de DPs distintos um ao outro. 
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concepção de derivação anterior à TRL e mesmo à Teoria Padrão, Parto 
agora do ponto em que parei no final da seção $3.6, no qual consideramos 
a sentença (82) no que concerne à sua estrutura sintagmática mais básica, 
no domínio do VP, tal como em (83). 


(82) Quem, o jornalista vai criticar tê 


(83) [” [P o, jornalista, ] [“ criticar, quem,,)] 


Mostro agora como a derivação segue até sua completude, conforme um 
sistema no qual operações sintagmáticas e transformacionais se aplicam 
intercaladamente, não ficando segregadas em etapas distintas. A operação 
sintagmática básica (Conectar) assemelha-se à clássica noção de transfor- 
mação generalizada, pois, em qualquer passo derivacional, unidades com- 
plexas (contendo em si estruturas formadas via transformações) podem 
ser conectadas através do mesmo mecanismo básico de formação de sin- 
tagmas simples. Cada unidade conectada seria como um mini-kernel, por 
assim dizer. Após (83), vai, se integra à estrutura, conectando-se ao VP, que 
passa a ser seu complemento. Forma-se o IP em (84). 


(84) ["vai, [9 [Po, jornalista, ] [“criticar, quem,)]] 


Nesse ponto, move-se o sujeito interno ao VP, realocando-o próximo a 1 
para satisfazer requerimentos morfossintáticos”, Na TRL, concebia-se um 
vestígio silencioso no lugar de origem do movimento, coindexado ao ele- 
mento movido. No PM, propõe-se algo mais simples, calcado em meca- 
nismos mais elementares, mais conceptualmente necessários como parte da 
cognição geral, adaptados às necessidades da linguagem, dispensando-se 
os vestígios indexados. Não há uma operação Mover, propriamente. Ela 
seria fruto da interação entre Copiar e Conectar. Copiar seria tão somente a 


90. Cf. discussão acima em torno de (69b) e (70). 
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criação de outra ocorrência de um objeto mental já existente; i.e. uma ver- 
são gramatical de uma capacidade cognitiva geral, sem custo para a teoria 
linguística. Na sintaxe, Copiar criaria “clones” de constituintes já formados. 
Critérios de economia previnem a multiplicação desenfreada de sintagmas. 
Cópias só são feitas quando requeridas. Voltemos a (84), em que temos um 
IP ainda sem especificador. 

O “movimento” de ["" o, jornalista, ] se dá em duas etapas. Via Copiar, 
cria-se outra ocorrência desse DP, que fica separada aguardando ser inte- 
grada à estrutura principal, como em (85a). Depois, essa cópia é conectada 
a IP, como em (85b), quando o que era um IP se torna um T) e um novo IP 
se forma como nódulo-mãe do [e do DP sujeito recém-conectado. 


(85a) ["vai, |” [Po, jornalista, |, [“criticar, quem, ]]]] ... [”"o, jornalista, ], 


(85b) [" [P o, jornalista] ["vai, [º [Po, jornalista, | [“criticar, quem,]]]] 


Não havendo vestígios coindexados, os referentes das duas ocorrências 
de o jornalista são idênticos por um ser cópia do outro. Após (85b), conec- 
ta-se esse IP a C, gerando (86a). C então “atrai” o sintagma-QU quem, para 
o seu especificador (a rigor, só existirá especificador após o 'movimento” 
de quem, ). Isso deflagra uma cópia de quem, , que paira em paralelo no 
espaço derivacional no passo (86b). Em (86c), essa cópia é conectada ao 
CP, que passa a ser um C e um novo CP se forma como nódulo-mãe do C” 
e do QU recém-conectado. 


(86a) [CC |" [Po, jornalista,] ["vai, [” [?"o, jornalista] [“criticar, quem,]]]]] 

(86b) [SC ['" [pr o, jornalista, ["vai, [” [” o,, jornalista, ] [” criticar, quem,)])] 
- quem, 

(860) [º quem, [ºC [” [" o, jornalista ] [“vai, [” [”” o, jornalista, ] [“criticar, 
quem,)])]]) 


Há duas cópias de quem, e duas de [” o, jornalista] em (860), sendo 
que apenas uma de cada é efetivamente pronunciada. Empiricamente, é 
inescapável conceber a superoperação Mover como mais que a interação 
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entre Copiar e Conectar. Seria necessária outra operação: Elidir (cuja exis- 
tência é independentemente motivada por fenômenos de elipse em geral)”, 
que afetaria as cópias mais profundamente encaixadas, resultando em (87). 


(87) [” quem, [ºC [º" [” o, jornalista] [" vai, [” e, sornalista,) [“ criticar, 
quer, |) 


Isso não é mero truque notacional para esconder a velha noção de vestí- 
gio. Na sintaxe, as múltiplas cópias de um sintagma “movido' existem de fato 
em todas as posições, o que é crucial para se capturar uma série de fenôme- 
nos com o mínimo de aparato técnico. Elidir seria aplicada no mapeamento 
entre a sintaxe e a fonologia. Duas questões emergem: (i) qual é a motivação 
para elidir as cópias mais encaixadas? Por que não se pode pronunciar to- 
das as múltiplas cópias? (o que parece mais econômico, pois, quanto mais 
se aplica Elidir, mais custoso isso seria); e (ii) em havendo elipse de cópias, 
por que a cópia conservada é a que c-comanda todas as demais? Há diver- 
sas propostas de resposta para essas perguntas (e.g. Hornstein 2001; Nunes 
2004). Para fins expositivos, sugiro pensarmos na necessidade de elipse de 
cópias em termos de Economia de Representação no nível fonológico: i.e. por 
default, nenhum elemento é redundantemente super-representado. A razão 
pela qual não há tensão entre economia derivacional e economia represen- 
tacional residiria no fato de Elidir se aplicar fora da sintaxe, portanto não 
interferindo no cálculo de economia de suas derivações. 

Entre a sintaxe e a fonologia, a elipse é necessária para tornar a repre- 
sentação fonológica mais econômica. A questão que sobra é por que có- 
pias mais c-comandantes têm preferência para serem pronunciadas. Por 
ora, sugiro que o mapeamento sintaxe-fonologia se dá como proposto em 


91, À intuição básica (Chomsky 1995a: cap 3) é que essa 'elipse de elo de cadeia! seja uma 
instanciação particular da mesma elipse que se dá em outros casos (e.g. Ele fugi, mas ela 
não firgir.), porém com algumas propriedades específicas, decorrentes do fato de se aplicar 
sobre cópias em relação de c-comando. 
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Fukui & Takano (1998), para quem o componente fonológico constrói a 
sequência terminal tomando a “árvore” como um todo, começando pelo 


nódulo mais dominante (i.e. aquele que domina todos os demais, o cha- 


mado nódulo raiz), e 'desmontando-a” em suas partes, como num castelo de 
cartas que se desfaz: i.e. a última carta a ser colocada é a primeira a cair, e a 
primeira a ser colocada é a última a cair. Sucessivas desconexões (imagem 
espelhada da história de conexões) alinham na 'fila de pronúncia” os ele- 
mentos encontrados mais cedo (i.e. os mais c-comandantes) antes daque- 
les encontrados mais tarde (i.e. os mais c-comandados). Nessa perspectiva, 
quando um elemento é reencontrado, é ignorado, pois já foi representado 
na estrutura fonológica em construção. 

Além do enxugamento do sistema ao se conceber movimento em ter- 
mos de cópias em vez de vestígios, há também ganhos empíricos. No que 
concerne ao nível fonológico, encontramos em Boskovié & Nunes (2007: 
48-69) vários casos em que fatores morfológicos ou prosódicos forçam o 
sistema a executar elisões de cópias de modo não canônico, como em (88), 
em que um sintagma-QU é pronunciado em mais de uma posição. É difícil 
prever tais padrões num sistema baseado em vestígios, sem apelar para um 
formalismo pesado e ad hoc. 


(88) Wen glaubt Hans wen Jakob gesehen hat? (alemão não padrão) 
Quem pensa Hans quem Jakob visto teve 
“Quem Hans pensa que Jakob viu? 


Quanto a aspectos de significado, uma das evidências empíricas a favor 
de cópias advém dos chamados efeitos de reconstrução, que tinham esse 
nome na TRL por serem concebidos como um movimento tardio — após 
SS e antes da interpretação do significado — no qual o elemento movido 
retorna ao seu lugar original. Essa sintaxe pingue-pongue' implicava um 
formalismo adicional não justificado (complicando as definições das res- 
trições sobre movimento), mas parecia se fazer necessária diante de dados 
como (89): 
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(89) [“” [P" quais [= fotos [”” de [P” si mesma, )]]), [ºC [” Audrey, escolheu t,]]] 


Tem-se aqui um sintagma-QU complexo: um DP com um determinan- 
te-QU cujo complemento é um NP que domina o DP anafórico si mesma, 
que deve ser correferente ao DP Audrey na posição de sujeito. O fato a 
princípio supreendente nesse dado é que ele parece contrariar generaliza- 
ções robustas acerca das estruturas contendo DPs anafóricos, respaldadas 
por uma vasta base empírica. A título de comparação, examinemos (90), 


em que si mesma deve remeter a a mãe de Audrey, jamais a Audrey, ou a 


qualquer outro DP externo. 


(90) |!” |" a [*” mãe ["” de [Audrey] ]]), [vai [? t, [9 olhar [” pra [Psi 
mesma! .,..]]]]] 


Pelo Princípio A da TL, uma anáfora deve ter o mesmo índice referencial 
do DP que a c-comanda mais proximamente e que está contido na menor 
oração não reduzida que a contém. Note que si mesmo é c-comandado por 
a mãe de Audrey, mas não por Audrey. Esse princípio explica (90) e inú- 
meros dados intrincados, mas parece falhar na descrição de (89), em que 
a anáfora si mesma claramente não é c-comandada por Audrey, embora 
ambos os DPs sejam interpretados como correferentes. Se o sintagma-QU 
complexo em (89) estiver em sua posição argumental interna ao VP, Au- 
drey c-comanda si mesma, o que explica a correferência (cf. Princípio A). 
Tal configuração se obtém em Estrutura Profunda (cf. (91)). 


(91) [9 [SC [" [ Audrey, escolheu ["” quais [= fotos ["” de [P" si mesma, . ]]]], ]]]] 
Contudo, assumir que princípios da TL se aplicam a (91) é inviável 


por motivos empíricos e conceptuais cuja elaboração não cabe aqui (cf, 
Chomsky 1995a: 200-212). Descartadas as estruturas profunda e superficial, 
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segue-se que, para (89), o sintagma-QU complexo está, no nível da Forma 
Lógica, na mesma posição em que figura em (91), resultante de um suposto 
movimento de retorno (reconstrução) do sintagma-QU à sua posição origi- 
nal, o que faria com que, nessa situação, a Forma Lógica fosse praticamente 
isomórfica à estrutura profunda. Em termos minimalistas, se Mover é Co- 
piar+Conectar(+ Elidir), então, na Forma Lógica, a estrutura de (89) é (92). 
A reconstrução é um epifenômeno de um processo de seleção de cópias a 
serem interpretadas naquele nível de representação”. 


(92) [9º [P" qu- fotos-de-simesma,] [CC [” Audrey, escolheu |?” gu- fotos de si 
mesma, |,]]) 


92. A cópia a ser escolhida para interpretação na Forma Lógica não precisa necessaria- 
mente coincidir com aquela escolhida para ser pronunciada. Neste exemplo, interpreta-se 
semanticamente justamente a cópia “silenciosa” 
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S4. A Abordagem 
Sintaticocêntrica da Conexão 
entre Som & Significado 


54.1. SINTATICOCENTRISMO, SIM! E DAÍ? QUAL É O PROBLEMA? 
QUAL É A SOLUÇÃO? 


Este capítulo é dedicado a esclarecer que a GGT, ao mesmo tempo em 
que é explicitamente sintaticocêntrica, não é uma teoria apenas sintá- 
tica que trata os aspectos da sintaxe isoladamente daqueles do som e do 
significado, tampouco toma sentenças como se elas fossem barulhos sem 
sentido. A GGT é sintaticocêntrica desde suas origens, mas o termo se tor- 
nou popular a partir de um modelo proposto por Culicover & Jackendoff 
(2005), que incorpora uma severa crítica às versões canônicas da GGT, cujo 
maior defeito, segundo os autores, seria o sintaticocentrismo, definido por 
eles como se segue (op. cit.: 17): 


Nas versões hegemônicas da GGT, toda a riqueza combinatória da linguagem 
deriva de regras do componente sintático; as propriedades combinatórias da 
fonologia e da semântica são caracterizadas inteiramente em termos do modo 
como elas derivam da estrutura sintática. A propriedade básica da lingua- 
gem — i.e. que ela é um mapeamento entre significados e sons codificados fone- 
ticamente — se segue do modo como um significado e uma codificação fonética 
são derivados de uma estrutura sintática comum. 


Nuanças à parte, chomskyanos típicos não fazem objeção à caracterização 
acima. Os autores legitimamente questionam a validade empírica e con- 
ceitual do sintaticocentrismo e propõem uma alternativa, que igualmente 
pode ser legitimamente questionada (como tem sido). É crucial, porém, ter 
em mente que o sintaticocentrismo — seja ele acertado ou equivocado — é 
uma concepção de gramática que visa explicar padrões de som e significa- 
do e as conexões (im) possíveis entre eles (cf. Chomsky 1975d). Não se trata 
de ignorar questões relativas ao som e ao significado ou relegá-las a um 
plano inferior, de pouca importância. Infelizmente, é muito difundido o 
mito de que a GGT despreza questões relativas ao significado. Nada pode- 
ria ser mais falso! Quanto à fonologia, a percepção geral é menos distorci- 
da, pois sabe-se bastante da existência da Fonologia Gerativa, cujos alicerces 
remontam ao clássico tratado de Chomsky & Halle (1968). O que não é tão 
conhecido do público geral é como a GGT, em cada uma de suas versões, 
concebe a relação entre a estrutura sintática e o significado. 

Enfim, o sintaticocentrismo não é uma tentativa malévola dos sintati- 
cistas de monopolizar a linguística. É apenas um corpo de hipóteses testá- 
veis e em grande parte (mas não totalmente) corroboradas, acerca de como 
som e significado se relacionam. Esta abordagem não é a priori superior 
nem inferior às outras abordagens sobre a conexão entre som e signifi- 
cado. A superioridade, inferioridade ou equivalência das abordagens só 
pode ser estabelecida a posteriori, comparando-se a cobertura empírica e 
o grau de elegância e consistência formal de cada uma (lembrando que 
é preciso atingir adequação nos cinco níveis descritos em $2.6, ou ao me- 
nos nos três primeiros). Não faltam na linguística abordagens classificáveis 
como lexicocêntricas, semanticocêntricas, pragmaticocêntricas, ete., bem como 
abordagens 'descentralizantes, como a de Culicover & Jackendoff (2005). 
Em princípio, todas elas são tentativas legítimas e dignas de consideração. 
Ao dizer isso, não estou defendendo a posição relativista de que todas as 
abordagens estão igualmente corretas, que se trata de 'variantes estéticas, 
modos de apresentação da mesma verdade. Trata-se de uma disputa real 
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pelo modelo o mais próximo possível da realidade. Mas a disputa não se 
encerra na escolha inicial das premissas; e sim no resultado final atingido, 
comparativamente às alternativas. Uma comparação completa e efetiva ul- 
trapassaria em muito o escopo deste livro. Atenho-me, portanto, a expor a 
concepção da GGT para a conexão entre som e significado, esclarecendo 
alguns mal-entendidos comuns. 


854.2. COMPONENTES E NÍVEIS DE REPRESENTAÇÃO: FATORAR É 
INEVITÁVEL! 


Tendo em mente o conceito de representação, tal como definido em 
$3.4, considere o dado (1), analisado como um complexo de vários níveis 
como em (2). 


(1) Quem, Natália viu t, nos espelhos? 
(2a) [PP Natália] [9,5] 1" ["v-] [” [quel"pessoa]) [fem] 


["os["espelhos]]]]] 
(2b) [É Pquel"pessoal), [É [[ºNatália]] [vin] [Pt] [Pt [em] 


["os[ espelhos)]]]]] 
(2c) *"$ que'pessoa"&"*Natália'4"&"v-, £ gem os'espelhos&"* 
(2d) ken n arara e viu nos e's p'e'N'o's'*/ 
(2e) [o O dA Aa O 


Esse esquema replica simplificadamente a argumentação de Chomsky 
(1955a: cap II, IV), retomada em Uriagereka (2002: cap 1). Todas as dis- 
cussões das últimas seis décadas sobre “arquitetura da gramática! (sobre- 
tudo as mais recentes, no âmbito do PM) pressupõem, ainda que implici- 
tamente, esse raciocínio clássico. A despeito de detalhes técnicos próprios 
de cada abordagem, havia realmente algo de totalmente novo nisso em 
1955? Não e sim. 
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Não, porque, desde o Estruturalismo que antecedeu a GGT já se reco- 
nheciam, de algum modo, níveis de análise: sintático, morfológico, fonoló- 
gico, fonético, etc. Sim, porque em (2) tem-se explicitamente: (i) a inclusão 
do nível transformacional, (ii) uma concepção particular de morfologia 
feita dentro da própria sintaxe, (iii) assunções específicas sobre os primiti- 
vos e os princípios combinatórios de cada nível, e, por último, mas não me- 
nos importante, (iv) a integração de todos esses níveis através do conceito 
de representação, aplicando-se entre níveis, tal que a compilação de uma 
complexa combinação de unidades atômicas em um nível atua como 
uma única unidade atômica no nível superior. (2a), (2b), (2c), (2d) e (2e), 
correspondem aos níveis sintagmático, transformacional, léxico-morfoló- 
gico, morfofonêmico e fonético, respectivamente. Ou seja, em suas versões 
iniciais (Chomsky 1951, 1955a), a GGT tomava todos os níveis estruturais 
como internamente organizados em termos de uma álgebra de concate- 
nação que opera com sequências, geradas numa derivação, uma a partir 
da outra, via regras que reescreviam símbolos não terminais. A relação de 
representação que vimos em $3.4 seria definível de modo semelhante em 
todos os níveis. Além disso, haveria a representação entre níveis. Por exem- 
plo, em (3) temos quatro objetos formais distintos, presentes nos níveis 
(2b), (20), (2d) e (2e), respectivamente, tal que o primeiro representa os 
três seguintes, o segundo representa os dois seguintes, e o terceiro represen- 
ta o quarto. Enfim, há uma equivalência entre o objeto fonético [k"&'j] eo 
objeto sintagmático [""que[“pessoa]], por exemplo. 


(3) [que["pessoa]] D 4"que"pessoa"4 D /K'e'n/ 9 [KE'j]. 


Se quisermos nos afastar dos conceitos linguísticos mais abstratos (por 
serem platônicos, intangíveis, idealizados), o que há de mais concreto é o 
sinal acústico, analisável em suas propriedades físicas: frequência, amplitu- 
de e duração, mensuráveis num continuum numérico. Nesse ponto, já não 
haveria mais nada de linguístico. Seria preciso dar ao menos um passo atrás, 
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e focar na nossa “abstração menor" (ainda assim, não pequena): o nível fo- 
nético. Partamos de (2e), repetido abaixo em (4a), que é a representação da 
sentença (1) no plano fonético. (4b) seria a representação fonética de Nos 
espelhos Natália viu quem, cuja aceitabilidade é passível de questionamen- 
to. Em (4c), temos Lhosno peviu zistalha quem na, claramente inaceitável, 


exceto nos níveis fonológico e fonético. (4d) soa como uma mera sequência 
aleatória de sons, violando qualquer padrão sonoro próprio da língua. 


(4a) [kBjnata.fe.viwnuzispe.fus]  (4b)? [nuzis.pe.Auz.viw.na.ta.fo.k8j] 
(4c) * [Auz.nu.pe.viw.zis.taAe.kejna) (4d) ** [Znpsi.wnAu.kutsv.iv.aj.e.a.84] 


Sem os níveis mais abstratos, como analisar os três últimos dados? Será 
que ao menos o contraste entre (4a) e (4d) poderia ser analisado apenas 
no nível fonético? Isso é bastante questionável, dada toda a evidência acu- 
mulada de que uma explicação adequada dos padrões sonoros requer no 
mínimo um nível fonológico de representação, no qual são codificadas 
alofonias, são definidos os ambientes de distribuição de alofones de um 
mesmo fonema, etc. No entanto, ainda que seja possível capturar tudo isso 
em termos puramente fonéticos, não haveria como explicar por que (4a) é 
gramatical, mas, por exemplo, (4c) não é. Para tanto, precisaríamos no mí- 
nimo identificar morfemas, sintagmas, etc. Qualquer tentativa de explicar 
o contraste entre (4a) e (4c) exclusivamente em termos de combinações 
possíveis e impossíveis de segmentos fônicos está fadada ao fracasso, ou 
será meramente uma lista das infinitas combinações possíveis, sem captu- 
rar generalização alguma. 

Chomsky (1955a: 93) sumarizou a inexorabilidade da postulação de ní- 
veis assim: 


A língua é um sistema enormemente complexo. A teoria linguística busca re- 
duzir essa imensa complexidade a proporções manejáveis através da elaboração 
de um sistema de níveis linguísticos, cada um deles disponibilizando um certo 
aparato descritivo para a caracterização da estrutura linguística. Uma gramática 
[hipotetizada] reconstrói a complexidade total da língua passo a passo, separan- 
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do a contribuição de cada nível linguístico. A adequação de uma teoria linguís- 
tica contendo um dado conjunto de níveis abstratamente formulados pode ser 
testada pela aferição de quanto as gramáticas resultantes da rigorosa aplicação 
dessa teoria (i) satisfazem certas condições formais de simplicidade; e (ii) nos 
levam a análises intuitivamente satisfatórias, i.e, oferecem explicações em bases 
formais para a intuição do falante nativo. 


Posto que a estrutura de uma sentença é um complexo de várias su- 
bestruturas relacionadas entre si (Chomsky 1955a: cap III), as perguntas 
são: (a) quantas são essas subestruturas?; (b) como cada uma é organizada 
internamente?; (c) como elas se relacionam entre si e com as demais partes 
do aparato cognitivo?; (d) quais mecanismos constroem cada subestrutu- 
ra?; e (e) quais mecanismos relacionam as subestruturas umas às outras? 
Nenhuma dessas perguntas tem uma resposta óbvia e autoevidente, Dada 
a complexidade do fenômeno linguístico geral, nenhuma teoria escapa da 
necessidade de fatorá-la e codificá-la de algum modo peculiar, onerando 
certas partes do sistema mais que outras. Mas tudo isso precisa ser bem 
justificado, e a grande questão nunca é “matéria vencida. Sempre se pode 
questionar e fazer contrapropostas, desde que muito bem fundamentadas 
empiricamente e conceitualmente, sem apelar para noções pós-modernas 
holísticas e escorregadias. 

Foram necessárias muitas gerações de cientistas para “mapear” o corpo 
humano, saber quais são seus órgãos, suas formas e funções e como eles in- 
teragem (a rigor, esse empreendimento científico ainda não acabou). E isso 
envolve não apenas observação, mas muitas conjecturas abstratas. Com a 
gramática não é diferente. A princípio, muitas hipóteses concorrentes pare- 
cem igualmente (im)plausíveis até que elas sejam desenvolvidas, testadas, e 
então corroboradas ou refutadas (parcial ou totalmente). Não raro, encon- 
tramos por aí ingênuos que acreditam dogmaticamente em máximas como 
“a forma segue a função”, ou “a estrutura sintática é determinada seman- 
ticamente”, ou “só existe uma estrutura sintática: a do nível de superfície, 
na qual não há ILs/sintagmas silenciosos”, etc. Cada conjectura dessas pode 
até ser verdadeira, mas nenhuma delas é autoevidente; assim como não são 
autoevidentes as conjecturas da GGT sobre o formato geral da gramática. 
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É igualmente ingênuo 'dar de barato” a existência de Estrutura Profunda 
e regras de movimento, por exemplo. Esse é um erro muito cometido por 
novatos entusiasmados que acabaram de ter contato com a GGT, e, preci- 
pitadamente, acham que dados como (1) acima, sozinhos, são, por si sós, 
evidência definitiva e inquestionável de que quem é gerado numa posição 
entre viu e no, e subsequentemente movido para a margem inicial. A maio- 
ria dos proponentes da GGT (eu, inclusive), defende que essa é a melhor 
análise disponível'. Mas as razões para se concluir isso passam por muito 
mais dados que somente aqueles do tipo (1), que pode ser analisado em ter- 
mos não transformacionais. Por trás dos argumentos pró-transformações, 
está sempre o objetivo de unificar as explicações para uma complexa teia de 
fenômenos distintos, concebendo-os como subfenômenos de um mesmo 
fenômeno geral. E isso envolve raciocínios complexos acerca da chamada 
“arquitetura da gramática como um todo, o papel de cada (sub)componen- 
te e como eles interagem. Trato disso na próxima seção. 

Antes, porém, é preciso clarificar minimamente a noção de componente 
da gramática, que, grosso modo, corresponde à de nível de representação. 
A discussão completa ultrapassa em muito os limites deste capítulo. Aos 
interessados, recomendo a leitura de Chomsky (1957: cap 6, 9), Chomsky 
(1955a: cap III, IV) e Uriagereka (2002: cap 1), nessa ordem. Por ora, é sufi- 
ciente termos em mente que, para cada sentença particular S, há um con- 
junto de estruturas (chamemo-las de S, S, Sp etc.) que são cada uma a 
representação de S nos níveis i, j, k, etc., respectivamente, e que cada repre- 
sentação é construída por um componente, no caso, I, J, K, etc., respecti- 


1. É seguro dizer que todos os chomskyanos defendem que (1) envolve alguma versão da 
noção de transformação de movimento-QU. Algumas, porém, se parecem à primeira vista 
com análises não transformacionais. Brody (1995), por exemplo, defende que quem seria 
gerado diretamente no especificador de CP e o vestígio estaria presente entre viu e no desde 
o início. Tal concepção continua sendo transformacional na medida em que a coindexação 
entre quem e o vestígio é uma regra sensível a contexto estrutural. Essa implemen- 
tação técnica alternativa já havia sido prevista por Chomsky (1973a, 1976a), e a equiva- 
lência formal entre ambos os sistemas transformacionais já havia sido diagnosticada por 
Chomsky (1982b: 71-72). 
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vamente, cada um sendo um conjunto de regras que atuam sobre estrutu- 
ras de certo tipo e geram estruturas de outro tipo determinado. Para fins 
práticos, definamos nível de representação como em (5) abaixo, a partir 
de Uriagereka (2002: 1), que, por sua vez, é uma simplificação a partir de 
Chomsky (1955a: 108; 1965: 222-223). 


(5) Um nível de representação da gramática, por definição, compreende: (i) um 
vocabulário de símbolos; (ii) procedimentos para formar associações entre os 
símbolos; (iii) uma classe de objetos formais admissíveis pelo nível particular; 
(iv) um procedimento de unificação; e (v) um procedimento de mapeamento 
dos diferentes níveis entre si. 


Dada essa definição, e dada a argumentação anterior sobre a necessidade de 
postularmos múltiplos níveis, a grande questão passa a ser saber quais são 
exatamente os níveis da gramática, quais são os detalhes que caracterizam 
cada um e como esses níveis se articulam entre si, em termos de qual forne- 
ce os ingredientes para qual outro construir suas estruturas. 


54.3. CONSIDERAÇÕES GERAIS SOBRE A ARQUITETURA DA 
GRAMÁTICA 


Dados os limites de espaço, esta seção sobre a articulação entre os ní- 
veis de representação em diferentes fases da GGT tem seu escopo histórico 
restrito ao periodo que começa com a Teoria Padrão (Chomsky 1965) e 
termina nas primeiras versões do PM. 

Na Teoria Padrão, a organização geral da gramática era resumível como 
em (6): 


(6) léxico > regras de base > DS 5 transformações > SS 


+ + 


[representação semântica] | [representação fonológica] 
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Nesse modelo, regras do subcomponente de base (de dois tipos: regras 
sintagmáticas e transformações locais de inserção lexical; cf. Chomsky 
(1965: 111-127)) constroem derivacionalmente um MS que define a Estru- 
tura Profunda (Deep Structure = DS), a qual é interpretada pelo compo- 
nente semântico além de ser submetida a operações sintáticas adicionais de 
transformação que culminam na Estrutura Superficial (Surface Structure = 
SS), que é processada pelo componente fonológico. Vimos acima (cf. $3,5) 
que, de acordo com a visão de Katz & Postal (1964), que constitui uma das 
bases para o modelo de Chomsky (1965) em (6), transformações não afe- 
tam a interpretação semântica, exceto na medida em que inter-relacionam 
MSs interpretáveis independentemente de modo fixo (cf. Lemle (1984) para 
uma apresentação pormenorizada desse modelo). Ilustro o funcionamento 
de (6) valendo-me da então assumida transformação de passivização em (7) 
que se aplicaria antes do salto do afixo e da concordância sujeito-verbo. 


(7) DE: NP,—Aux—V—NP, (Chomsky 1957: 43, 112) 
ME: XXX X XX SER'Part—x, — por'x, 


Nessa perspectiva, a mesma DS em (8) seria o ponto de partida comum 
para a derivação de ambas as sentenças em (9). A transformação em (7) 
supostamente preservaria as relações semânticas básicas acerca de quem é 
o agente e o paciente da ação, o tempo da ação, etc. 


(8) Beatrix— [passado] — assassin- — Bill 


(9a) Beatrix assassinou Bill. (9b) Bill foi assassinado por Beatrix. 


O sintaticocentrismo deste modelo é evidente. As posições sintáticas 
ocupadas por Beatrix e Bill em (9a) e (9b) são distintas, mas em ambos os 


2. É importante frisar que (9a) e (9b) seriam derivadas de uma DS comum; e não que (9b) 
seria derivada a partir de (9a), embora (9b) sofresse uma transformação a mais. Essa é uma 
confusão frequente que é preciso evitar. 
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casos Beatrix é agente e Bill é paciente. Essas funções semânticas estariam 
determinadas na DS comum em (8). Em (9b), há, entre a DS e a SS, uma 
mudança substancial de posições, que — segundo se argumentava — afetaria 
apenas a fonologia (ordem de pronúncia e prosódia), mantendo a semân- 
tica intacta, Diante da estrutura transformada (9b), a 'recuperação” do seu 
significado por parte de quem vai interpretar só é possível com a interme- 
diação da sintaxe (i.e. a “aplicação reversa” da transformação em (7)), que 
estabelece o elo entre semântica e fonologia. 

Essa análise específica das sentenças passivas passou a ser contestada 
diante de dados como (10) e (11), apontados por Klima (1964). A discus- 
são que se segue abaixo é baseada em Lemle (1984: cap 2), que por sua vez 
se baseia em Lakoff (1970) e Jackendoff (1972). 


(10a) Muitas pessoas leem (10b) Poucos livros são lidos por 
poucos livros. muitas pessoas. 

(1a) Muitas flechas não atingiram (11b) O alvo não foi atingido por 
oalvo. muitas flechas. 


Os pares (10) e (11) apresentam contrastes de significado muito mais 
substanciais que aquele que porventura possa ser atribuído a (9)º. (10a) 
e (10b) não são sinônimos. Em (10a) tem-se que muitas pessoas se refe- 
re a um numeroso conjunto determinado de pessoas, tal que cada uma 
leu poucos livros, não estando especificados quais, nem se são ou não os 
mesmos para cada leitor. Em (10b) tem-se que poucos livros se refere a 


3. Diz-se que (9a) veicula informação sobre Beatrix: ela matou Bill; ao passo que (9b) vei- 
cula informação sobre Bill: Beatrix o matou. Embora isso seja um fato a ser tratado pela 
teoria linguística de algum modo, é defensável que isso nada tenha a ver com a sintaxe, e 
talvez nem com a semântica, pois o conteúdo proposicional e os contextos que tornam 
(9a) verdadeiro também tornam (9b) verdadeiro e vice versa; e os contextos que tor- 
nam (9a) falso tornam (9b) falso e vice versa. Trata-se de um contraste de “ponto de vista” 
no âmbito do conteúdo informacional, potencialmente atribuível à competência pragmá- 
tica que interpreta as representações semânticas de (9a) e (9b), que de algum modo confere 
um estatuto especial de tópico default à posição de sujeito. 
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uma pequena coleção determinada de livros, tal que cada um deles foi lido 
por muitas pessoas, consequentemente, cada uma dessas muitas pessoas 
necessariamente leu os mesmos livros dessa pequena coleção, o que não 
é necessariamente o caso em (10a). Em (1la) tem-se que há um nume- 
roso conjunto de flechas específicas, tal que nenhuma atingiu o alvo; mas 
isso não implica necessariamente que o alvo não tenha eventualmente sido 
atingido por (muitas) flechas de um outro conjunto específico. Em (11b) 
tem-se que o alvo não foi atingido por muitas flechas, tendo sido atingido 
apenas por poucas, ou por nenhuma. Apenas (1 b) pode ser sinônima de 

Para Klima (1964: 272), tais fatos indicavam que transformações afeta- 
riam o significado, contrariamente ao que defendiam Katz & Postal (1964) 
e Chomsky (1965). Para Lakoff (1970), isso seria evidência empírica para 
se postularem DSs diferentes para cada membro dos pares, o que o autor 
propôs no âmbito do quadro teórico da Semântica Gerativa, antagônico 
à perspectiva de Chomsky (1965). Além de quantificação e negação, ou- 
tros fenômenos — como foco e pressuposição, e discrepâncias entre papel 
semântico e caso morfossintático de NPs — apresentavam desafios seme- 
lhantes em tipo e magnitude para a organização de gramática em (6), ao 
ponto de ela se mostrar inviável. Chomsky (1970b) faz um diagnóstico 
meticuloso dos casos críticos e pavimenta o caminho para a reformulação 
do modelo em (6) em termos de (12), que ficou conhecido como Teoria 
Padrão Estendida. 


(12) léxico > regras de base > DS > transformações > SS > [representação fonológica] 
o] 4 
[representação semântica) 
Um ingrediente-chave para essa reformulação advém de Chomsky (1973a), 


para quem toda SS cuja derivação envolve transformações de movimento 
contém vestígios (cf. $3.1,n.11) nas posições em que os elementos movidos 
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ocuparam em DS. Isso viabiliza uma implementação técnica sintaticocên- 
trica da proposta de Jackendoff (1972) de que o componente semântico 
dispõe de um mecanismo interpretativo que lê ambas a DS e a SS e as ma- 
peia em uma estrutura semântica que codifica simultaneamente a estru- 
tura argumental básica (i.e. noções como agente ou paciente de uma dada 
ação) e relações de escopo, como as que se alteram com a transformação 
de passivização em (10) e (11)'. Jackendoff (1972: 332-333) nota que, além 
das passivas, transformações de movimento em geral alteram relações de 
escopo, como em (13) e (14), que corresponderiam, respectivamente, às 
interpretações em (15) e (16). 


(13a) [Muitas pessoas], leram [poucos livros], 
(13b) Foram [poucos livros], que [muitas pessoas), leram t 
(14a) [o alvo], não foi atingido t, [por muitas flechas], . 


(14b) [Por muitas flechas], [o alvo], não foi atingido t, t,. 


(15a) Para muito x tal que x é pessoa, há pouco y tal que y é livro e x lê y. (=13a) 
(15b) Para pouco y tal que y é livro, há muito x tal que x é pessoa e x lê y. (=13b) 
(162) Para muito x tal que x é flecha, é falso que x atingiu ytalque yéoalvo. (=14a) 
(16b) É falso que para muito x tal que x é flecha, x atingiu y tal que y é o alvo. (=14b) 


A análise esboçada acima está bem sumarizada nas palavras de Lemle 
(1984: 29-30): 


Vejamos como esse tipo de procedimento interpretativo reflete as percepções 
semânticas elicitadas pelas sentenças. Na forma lógica de [15a], o fato de a de- 
terminação do conjunto contendo x (pessoas) preceder a do conjunto y (livros) 
equivale a tratar x como uma variável independente e y como uma variável 
dependente, o que é exatamente o equivalente lógico da percepção que se quer 
captar. A forma lógica de [15b] dá exatamente o contraste desejado, o de que 


4. A propósito de uma compreensão mais completa do desenvolvimento dessas ideias na 
GGT, acrescento que o livro de Jackendoff (1972) deriva de sua tese de doutorado (Jacken- 
doff 1969), orientada por Chomsky. Logo, vê-se que o caminho tomado (i.e. interpretação 
de estruturas de derivação tardia) foi uma reação rápida às constatações dos limites e falhas 
do modelo de Chomsky (1965). 
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na sentença passiva concebemos o conjunto de y (livros) como a variável inde- 
pendente e o conjunto de x (pessoas) como a variável dependente. Na forma 
lógica de [16a], a quantificação do conjunto de flechas precede a negação, o que 
se presta a representar o fato de que a quantificação está fora do âmbito da ne- 
gação. [...] Ao contrário, para a sentença [16b], a forma lógica, tendo a negação 
antes da quantificação, coloca esta dentro do âmbito daquela [ 


Ainda sobre a Teoria Padrão Estendida, faço duas observações. Primeira- 
mente, alerto que, na passagem de Lemle acima, a autora descreve as rela- 
ções de escopo (dizer que a variável x é independente e a variável y é depen- 
dente equivale a dizer que x tem escopo sobre y) em termos de precedência, 
o que é uma forma simplificada de introduzir o assunto. A rigor, relações 
de escopo decorrem de relações hierárquicas entre os elementos relaciona- 
dos (grosso modo, x tem escopo sobre y se x c-comanda y (cf. May 1977: 25; 
1985: 5)). Em segundo lugar, alerto que, em (13) e (14), eu propositalmente 
acrescentei vestígios, que não constavam nos dados originais de Jackendoff 
que Lemle adaptou para o português. Como veremos na próxima seção, 
vestígios (ou algo equivalente, como cópias, cf. $3.7) são cruciais para que 
as interpretações em (15) e (16) sejam obtidas por meios sintaticocêntri- 
cos, com o significado representado na própria estrutura sintática, posto 
que o elemento movido e seu vestígio formam uma cadeia com dois ele- 
mentos ligados através de seus índices (i.e. x, y), o que permite se obter o 
significado e as relações de escopo de modo bem transparente. 

O modelo descrito acima foi uma fase de transição relativamente curta 
da GGT. Diante dos dados-chave que colocaram em xeque (mate) certas 
bases do modelo de Chomsky (1965), tomou-se então o caminho de reco- 
nhecer que certas propriedades do significado são extraídas da SS, pois as 
relações sintáticas que forneceriam tal informação não se fazem presentes 
na DS. Por outro lado, aspectos básicos do significado, como relações de 
agente ou paciente, dependeriam das configurações sintagmáticas da DS, o 
que motivou o modelo no qual o componente semântico acessa ambas as 
estruturas sintáticas. Durante essa fase, que culminaria na TRL (Chomsky 
1981a, et seq.), algumas obras-chave — dentre as quais se destacam 
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Chomsky (1975b), e as teses de doutorado de Ivan Sag (1976) e de Robert 
May (1977), orientadas por Chomsky — levaram um passo adiante a ideia 
da extração do significado a partir de níveis sintáticos mais tardios, com a 
postulação de um terceiro nível de representação sintático: a Forma Lógica 
(Logical Form = LF), gerada a partir da SS, após a derivação se “bifurcar e 
a informação de SS ser mapeada pelo componente fonológico no nível da 
Forma Fonética (Phonetic Form = PF), conforme o esquema em (17). 


(17) léxico > esquema X-Barra > DS > mova-a > SS 5 mova-a > LF 
critério theta construal Nr construal 
PF 


Nesse modelo, a DS é projetada a partir do léxico por meios puramente 
representacionais (regras declarativas de boa formação de sintagmas), que 
se resumem ao esquema X-Barra (cf. $3.6 acima) e ao Critério Theta, de 
que tratarei em $4.4.2. Em DS estão codificadas as noções mais básicas do 
significado (e.g. transitividade, o que é agente ou paciente, qual é o evento, 


adjuntos, etc.). Desse ponto, as demais relações sintáticas são construídas 
derivacionalmente a partir de DS, aplicando-se a transformação de movi- 
mento até se obter SS, que, por sua vez, deve obedecer a regras represen- 
tacionais de boa formação, que também são transformacionais por rela- 
cionarem elementos em referência ao contexto estrutural em que ocorrem 
(e.g. controle, princípios de ligação A, B e C, etc.) — cf. $3.7º. 

Assim como ocorre com DS, as regras representacionais aplicáveis em 
SS são filtros, que “barram' estruturas que não obedecem a seus requisitos e 
“deixam passar” as que os obedecem; não são regras que 'constroem' a estru- 
tura desejada. SS é então submetida a mais uma 'rodada” de transformações 
de movimento (essencialmente do mesmo tipo, com algumas diferenças 


5. Cf. Haider & Netter (1991: 1-15) para uma lúcida reflexão sobre a dicotomia representa- 
ção/derivação na TRL. 
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sutis que infelizmente não cabem nesta apresentação), culminando com a 
estrutura LF, que, como já dito, é um nível de representação sintático, mas 
que codifica em si uma série de propriedades que em outras abordagens são 
atribuídas a uma estrutura pós-sintática, de natureza puramente semânti- 
ca. Elaborarei um pouco sobre isso em $4.4.1. Devido a LF ser formada por 
transformações aplicadas a SS, há uma certa discrepância" entre o som e o 
significado de uma sentença (PF e LF, respectivamente). Ambos derivam de 
SS, mas as transformações ocorridas entre SS e LF não são refletidas em PF. 
Logo, diferentemente do que se cogitou durante a Teoria Padrão Estendida, 
a representação do significado na TRL não estaria na superfície, mas na 
'pós-superficie. A rigor, parte do significado estaria na pré-superficie (DS) 
e outra parte na pós-superfície (LF). 

A concepção esboçada acima foi posteriormente reformulada segundo 
as diretrizes do PM, que busca reduzir o aparato formal ao mínimo neces- 
sário, eliminando redundâncias. A mais flagrante delas diz respeito a uma 
herança da Teoria Padrão Estendida quanto à representação do significado 
estar fatorada entre a DS e LF. A partir do momento em que se assume que 
(1) SS e LF contêm vestígios dos sintagmas movidos nas posições em 
que eles foram gerados, e (ii) tais vestígios estão ligados (via índices) aos 
elementos movidos, então a necessidade de se postular o nível DS se torna 
mais questionável, pois, em princípio, informações tradicionalmente con- 
cebidas como codificadas em DS (e.g. agente ou paciente de um evento) 
podem ser extraídas diretamente de LF por meio de vestígios. 

Se a Teoria Padrão foi ampliada, a TRL veio a ser reduzida. O modelo 
em (17) previa, para toda sentença, quatro níveis de representação: DS, SS, 
PF e LF. De um lado, PF e LF são inescapáveis. Qualquer abordagem pre- 
cisa conceber, para cada sentença, uma estrutura legível pelos processos 
cognitivos que lidam com som, e outra legível pelos processos cognitivos 
que lidam com significado. A hipótese minimalista é que a gramática não 
possui os níveis de representação internos DS e SS, apenas os que fazem 
interface com sistemas extragramaticais. Assim, a arquitetura da gramática 
seria como em (18). 
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(18) léxiio-s» LF 


4 
PF 


Em (18), ILs combinam-se (por meios sintagmáticos e transformacio- 
nais intercalados) até a formação de LF: o único nível de representação 
sintático. Ao longo da derivação, não há nem DS nem SS, apenas estruturas 
sintáticas parciais, versões incompletas de LF. A bifurcação em (18) não 
corresponde a S$; apenas a um passo intermediário da construção de LF 
no qual se aplica uma regra de transferência do material morfofonológi- 
co carregado até então para o componente relevante, que constrói PF. Tal 
transferência é deflagrada pelas propriedades morfofonológicas dos ILs en- 
volvidos e pelas demandas do componente fonológico, que determinam o 
momento em que a transferência se dá. 

Nessa visão, todas as condições de boa formação de estrutura se seguem 
ou de demandas dos níveis de interface — tomadas como condições de le- 
gibilidade — ou de princípios de economia derivacional do “sistema com- 
putacional” construtor de estrutura. A gramática só contém mecanismos 
conceptualmente necessários para construir, de forma ótima (i.e. com o mi- 
ninum minimorum de custo computacional) estruturas interpretáveis pelos 
sistemas de desempenho”. Dispensar DS e SS implica reconceber princípios 
antes entendidos como aplicáveis nesses níveis, tomando-os agora como 
aplicáveis em LF (ou PF). 


854.4. HÁ LUGAR PARA A SEMÂNTICA NA LINGUÍSTICA 


CHOMSKYANA? 


Nas centrais de boatos da academia, uma das mentiras contadas milha- 
res de vezes até atingirem o estatuto social de verdade é que a abordagem 


6.A gênese dessa ideia já se encontrava em Chomsky (1951: 52): “o aumento da simplicida- 
dese obtém [...] pela redução do comprimento das derivações”. Chomsky (1986a) também 
é uma referência-chave nesse sentido. 
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chomskyana de gramática ignora solenemente questões relativas à semân- 
tica das sentenças, tratadas como meros arranjos de ILs que obedecem a 
regras combinatórias totalmente cegas à função comunicativa dos enun- 
ciados das sentenças. Há, porém, uma meia-verdade nisso, e que precisa ser 
devidamente esclarecida porque ela não é o que parece ser a olhos desavi- 
sados. Primeiramente, é importante entender que, esteja Chomsky certo ou 
errado, sua posição parte de um questionamento da visão do senso comum 
quanto ao que seja a semântica e a sintaxe, e como elas se relacionariam. 
Numa das pedras fundamentais da GGT, Chomsky (1965: 159) deixa claro 
que não “dá de barato” que existe um componente semântico que abarque 
os fenômenos tradicionalmente rotulados como semânticos”. 


Decidir sobre onde estabelecer a fronteira entre sintaxe e semântica (se é que 
existe uma) não é pré-requisito para o estudo teórico e descritivo de regras sin- 
táticas e semânticas. Ao contrário, a questão da delimitação certamente perma- 
necerá aberta até que esses campos sejam muito mais bem compreendidos do 
que são atualmente. Exatamente o mesmo pode ser dito sobre a fronteira que 
separaria sistemas semânticos de sistemas de conhecimento e crença. Há muito 
tem-se notado que essas coisas se interpenetram de maneiras obscuras. 


A visão chomskyana sobre questões do significado sempre foi “sintati- 
cocêntrica' (cf. $4.1). Ao longo do desenvolvimento da GGT, os praticantes 
das versões mais hegemônicas foram gradativamente tendendo a respon- 
der negativamente ao questionamento “se é que ela existe” da passagem 
acima, sobre uma eventual fronteira entre sintaxe e semântica. A posição 
que se firmou, então, é a de que, no limite, não existiria um componente se- 
mântico propriamente dito na gramática. Mas isso não significa, de modo 
algum, que questões relativas ao significado devam ser negligenciadas. Fe- 
nómenos relativos ao significado sempre ocuparam lugar de destaque na 
pesquisa na GGT, e sempre serviram como evidências contra e a favor de 
análises morfossintáticas específicas. Reformulo então, em termos mais ge- 
rais, a pergunta que abriu esta subseção. 


7. É digno de nota que, norteando uma discussão contemporânea sobre interface entre 
semântica e pragmática, Cappelen (2007: 19-20) conclui que a distinção entre as duas dis- 
ciplinas é equivocada. 
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84.4.1. Há lugar para a semântica na teoria linguística? 


Desde as primeiras discussões sobre a independência da gramática ou 
autonomia da sintaxe, ilustradas com o famoso exemplo Ideias verdes inco- 
lores dormem furiosamente (cf. $2.1), tem sido difundida a crença genera- 
lizada de que tal autonomia (i) seria uma premissa, uma opção metodoló- 
gica; e (ii) implicaria excluir da linguística o estudo de quaisquer questões 
semânticas, tidas como irrelevantes, sobretudo aquelas relativas aos atos de 
fala no uso real da língua. Há nisso muitos mal-entendidos graves a serem 
esclarecidos. 

Quanto a (i), trata-se de uma meia-verdade. Enquanto hipótese de tra- 
balho num empreendimento científico pautado na dedução”, a autonomia 
da sintaxe tem um inevitável caráter apriorístico, como qualquer generali- 
zação abstrata acerca da realidade como um todo, feita antes de se averiguar 
sua validade caso a caso, exaustivamente. Cabe ressaltar, porém, que tal hi- 
pótese tem sido amplamente testada e corroborada em muitíssimos casos, 
não lhe faltando embasamento empírico. Logo, trata-se, sobretudo, de uma 
conclusão (ainda que com detalhes abertos a questionamento, podendo tal- 
vez não se mostrar 100% verdadeira em sua versão extrema), e não de uma 
mera conjectura não testada e sem embasamento empírico. Quanto a (ii), 
do ponto de vista chomskyano, embora o estudo do significado das expres- 
sões linguísticas seja crucial para qualquer teoria linguística, defende-se que 
a melhor abordagem para o significado não está numa teoria semântica, 
mas numa teoria sintática. Esta visão já estava claramente posta no texto 
seminal da GGT, em que Chomsky (1955a: 93-94) afirma: 


Em lugar do desafio costumeiro “como se poderia fazer análise linguística sem 
recorrer ao significado”, é perfeitamente apropriado se perguntar em quais 
pontos noções semânticas poderiam exercer um papel determinante para o es- 
tabelecimento de noções gramaticais. Não é nada evidente que haja qualquer 


8. Para uma distinção entre indução e dedução, bem como uma defesa da última como 
método de investigação, cf. Bach (1965) e Chomsky & Fodor (1980), além da vasta obra do 
filósofo Karl Raimund Popper. 
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maneira de vencer esse desafio. Até sermos apresentados a alguma maneira inte- 
ressante e promissora de cumprir tal meta, devemos evitar asserções como “tal e 
qual é uma tentativa de construir uma teoria gramatical sem apelo ao significa 
do, Ainda que isso seja literalmente verdadeiro, é muito enganador, pois a im- 
plicação de que existe uma alternativa não foi demonstrada. [...] É verdade que 
nossas intuições sobre a forma linguística podem ser úteis no processo de coleta 
e organização de dados linguísticos, mas isso não implica que nossas intuições 
sobre o significado sirvam aos mesmos propósitos. O que quer que o significado 
seja, ele certamente não é intuição sobre a forma. 


A passagem acima deve ser devidamente interpretada no contexto da 
argumentação completa, a qual não cabe aqui reproduzir nem resenhar. 
Apenas acrescento que, três parágrafos adiante, aparece pela primeira vez 
na história o famoso exemplo Ideias verdes incolores dormem furiosamen- 
te, apresentado como forte evidência de que a forma não depende do sig- 
nificado, em contraposição à posição de Willard van Orman Quine, para 
quem as noções de sinonímia e significância deveriam nortear a investi- 
gação gramatical. Isoladamente, esse fragmento pode sugerir um grande 
desprezo de Chomsky por questões de significado como um todo, o que não 
era o caso na época, muito menos nas fases posteriores da GGT, em que 
mais e mais fenômenos relativos ao significado passaram a ser investigados. 

A visão inicial de Chomsky acerca do significado fica um pouco mais 
clara em seu livro de dois anos depois, na apresentação didática do capítulo 
intitulado Syntax and Semantics. Em meio a uma apresentação de fatos e 
argumentos que refutam pontos-chave (amplamente aceitos na época e ain- 
da hoje) da visão de que não seria possível construir uma teoria gramatical 
sem recorrer fortemente ao significado, Chomsky (1957: 101-102) reafirmaº: 


[Tais] contraexemplos não devem nos cegar para o fato de que há correspon- 
dências surpreendentes entre as estruturas e os elementos descobertos por uma 
análise gramatical, formal, e funções semânticas específicas. [..] Parece[m] exist[ir] 
correspondências inegáveis, [embora] imperfeitas, entre características formais 
e semáânticas da linguagem. [A inexatidão de tais correspondências] sugere que 
o significado é inútil para servir de base para a descrição gramatical. [..] In- 


9, Essa concepção de relação entre estrutura e significado já estava em Chomsky (1955b), 
em resposta a Bar-Hillel (1954). O tema é retomado posterioremente em Chomsky (1970b, 
1986a, 2000), e outros textos. 
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tuições importantes sobre a estrutura linguística podem ser perdidas se pistas 
semânticas vagas forem seguidas excessivamente de perto. [...] O fato de que as 
correspondências entre as características formais e semânticas existem [...] não 
pode ser ignorado. [Elas] devem ser estudadas dentro do panorama de uma teo- 
ria mais geral da linguagem, que incluirá uma teoria da forma linguística e uma 
[..] do uso da língua. [...] [E]xistem [...] relações bem gerais entre esses domi- 
nios que merecem um estudo mais detalhado. Uma vez determinada a estrutura 
sintática da língua, podemos estudar o modo com que [ela] é posta em uso no 
funcionamento real da língua. Uma investigação da função semântica de níveis 
gramaticais [...] poderia se configurar em um passo razoável em direção a uma 
teoria das interconexões entre Sintaxe e Semântica. |...) [A]s correlações entre 
a forma e o uso da língua podem até mesmo fornecer certos critérios brutos de 
adequação para uma teoria linguística e [...] as gramáticas [para as quais ela 
aponta]. Podemos julgar as teorias formais em termos de sua habilidade para 
explicar e elucidar uma variedade de fatos sobre o modo como as sentenças 
são usadas e compreendidas. [...] [Pretendemos] que o [arcabouço] sintático 
da língua, isolado e exibido pela gramática, [seja] capaz de sustentar a descri- 
ção semântica, e naturalmente daremos mais valor a uma teoria da estrutura 
formal que conduza a gramáticas que satisfaçam esse requisito de modo mais 
completo. A[s] estrutura|s| sintagmática e transformacional parecem fornecer 
os principais instrumentos sintáticos disponíveis na língua para a organização 
ea expressão do conteúdo. 


Na mesma linha, Hornstein, (1984: ix) em seu livro Logic as grammar", 


enfatiza: 


Creio que as abordagens atuais para o significado oferecidas pela Semântica de 
Modelos"! fazem pouco para explicar a natureza das habilidades interpretativas 
do falante nativo. Creio também que os interessados no tema do significado 
em línguas naturais fazem um desserviço a si mesmos ao ignorar a abordagem 
da Gramática Gerativa (tanto sua metodologia geral como seu aparato técnico 
específico) para o significado. [...] De um lado, a importância da perspectiva 
gerativista para questões da teoria do significado é subestimada; de outro, a 
centralidade de noções semânticas [e.g. verdade, referência, objeto, propriedade, 
modelo] para a teoria das línguas naturais é frequentemente superestimada". 


10, Esse título contrasta com Grammar as logic, de Morrill (1989), que defende a Semântica 
de Modelos (SM). 

1. Bach (1989), Borges Neto (2003), e Hodges (2013) são introduções acessíveis à SM. 
12. Chomsky (1957: 103) já afirmava que “ [noções semânticas como referência, significa- 
ção e sinonímia não desempenham qualquer papel na discussão”. Isso não significa que es- 
sas noções não tenham seu lugar na teoria linguística (sejam elas primitivas ou derivadas). 
Questiona-se sua centralidade; e propõe-se que é majoritariamente (ou totalmente) através 
da própria sintaxe que o significado é mais bem capturado/explicado. 
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Borges Neto (2003: 9), no âmbito da própria Semântica de Modelos 
(SM), admite: 


[A definição de Semântica como 'o estudo do significado”), na medida em que 
assume que o termo 'significado' é univoco e que o conceito associado é claro, 
cria mais problemas que resolve [...], deixa-nos com o espinhoso problema de 
dizer o que é o significado, antes de dizermos o que é a Semântica, que o estuda. 


De qualquer modo, é fato que as sentenças significam. Costuma-se conce- 
ber uma teoria semântica, distinta da sintaxe, para tratar do significado das 
sentenças", Para Chomsky, principalmente a partir da TRL, isso pode ser 
feito na própria sintaxe. Muitos acham essa proposta demasiado presun- 
çosa e até acintosa. Lembro, porém, que, em versões mais fortes de teorias 
gramaticais baseadas na SM, o exato oposto é proposto. O principal ex- 
poente dessa visão foi Richard Montague, cuja obra influenciou enorme- 
mente uma parcela majoritária do que passou a ser feito nas teorias formais 
de semântica. Para Montague (1970a, 1970b), o significado das sentenças 
é calculado não a partir da expressão linguística em si, mas sim a partir de 
uma tradução daquela expressão numa outra expressão de uma metalín- 
gua lógica, que seria um modelo do mundo ao qual as sentenças se referem 
(cf. Bach 1989: 8-9). Adiante, Borges Neto (2003: 9-10, 19-21) resume bem o 
quadro geral para o leitor iniciante: 


[A] natureza não física dos significados coloca problemas [...] para todas as abor- 
dagens [...] que pretendem considerá-los uma espécie de entidade. |...] Dizer que 
o significado de uma expressão é a “coisa! a que a expressão refere só é razoável 
quando tratamos de expressões que designam objetos [fisicos]. [...] [DJiante de 
nomes abstratos, como “liberdade” [...), [isso] já não parece [...] razoável. [...] O 
procedimento corrente, então, é considerar que o significado é uma espécie de 
relação, e não uma entidade. |...) [TJodos os linguistas concordam que o signifi- 
cado de uma expressão é uma relação que se estabelece entre essa expressão e algo 
não linguístico. [...] [SJe pensarmos no aeromodelismo [ou] no ferromodelismo, 
[...] teremos de um lado o avião ou o trem original cuja representação em escala 
é o modelo, [...] Para uma teoria formal, [...] o modelo é uma estrutura (um 
conjunto de objetos atômicos com propriedades e relações definidas entre esses 


13, Chierchia (1997 [2003: 36-48]) apresenta brevemente as três principais abordagens para 
se construir tal teoria semântica, seus alcances e limites. 
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objetos) construída de tal forma que os teoremas da teoria resultam verdadeiros 
quando interpretados nos elementos da estrutura: 'modelo' é o sistema em que se 
cumpre o que diz a teoria. [...] [CJonstruir um modelo para uma teoria é cons- 
truir um sistema em que todas as afirmações da teoria encontrem um corres- 
pondente verdadeiro. De certa forma, as relações entre teorias e modelos não são 
mais do que as relações entre sistemas distintos. Voltemos às línguas naturais. 
Como vimos acima, a tarefa da semântica é relacionar as expressões linguísticas 
a objetos não linguísticos. Vimos também que esses objetos não linguísticos de- 
vem ser estudados num sistema de algum tipo. Ora, nesse caso a semântica vai 
justamente trabalhar na relação entre dois sistemas: um sistema linguístico e o 
mundo. [...] A estruturação do polo linguístico da relação semântica (a descrição 
do sistema linguístico [...]) vai ser obtida na sintaxe da língua natural. Esse é o 
papel dos estudos sintáticos: descrever a organização do sistema linguístico, sem 
levar em conta o mundo e/ou as relações entre a linguagem e o mundo. Pode-se 
dizer, então, que a sintaxe tem certa autonomia e anterioridade lógica com rela- 
ção à semântica — não se pode fazer semântica sem que se faça, antes ou simulta- 
neamente, sintaxe. [...] O procedimento dos semanticistas tem sido o de propor 
modelos bastante simples do mundo e tentar interpretar neles o maior número 
possível de sentenças das línguas naturais. 


Nessa família de abordagens com um viés da SM, destaca-se particular- 
mente a Gramática Categorial (GC), que consiste de desenvolvimentos do 
chamado “modelo AB! - nomeado em referência a Ajdukievicz (1935) e Bar- 
-Hillel (1953) — a partir das ferramentas de cálculo de Lambek (1958, 1961). 
Trata-se de uma abordagem antagônica à chomskyana, por rejeitar a ideia de 
que um componente de regras e princípios sintáticos teria um papel central 
na combinatória que produz as expressões linguísticas a serem interpretadas 
num modelo. Moortgat (1988: 1), por exemplo, defende que a sintaxe seria 
uma álgebra livre. Ou seja, todos os requerimentos sobre combinações possi- 
veis estariam codificados (algebricamente) nos próprios ILs, e a sintaxe não 
teria recursos próprios para fazer nada mais que apenas aplicar automatica- 
mente tais instruções algébricas, sem impor seus próprios requerimentos". 


Teorias orientadas para a superfície exibem uma tendência comum de deslo- 
car o ônus explicativo do componente sintático para o léxico. Por exemplo, a 


14, Nesse caso, livre não significa 'sistema autónomo com suas próprias regras indepen- 
dentes), mas sim 'um subsistema da lógica geral, destituído de idiossincrasias, um mero 
executor de requerimentos externos. 
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GPSG, ao desenvolver uma concepção mais rica de estrutura categorial, elimina 
o componente transformacional da GGT clássica. A GC leva esse movimento 
na direção do lexicalismo um passo além, eliminando o próprio componente 
sintagmático, A informação sintática é projetada inteiramente das estruturas 
categoriais atribuídas aos Ls. Em sua forma mais pura, a GC identifica o léxico 
como o único locus de idiossincrasias das línguas. A sintaxe é uma álgebra livre: 
uma combinatória universal guiada pelas estruturas categoriais complexas. 


Jáger (2005: 16) também defende explicitamente que a sintaxe não exis- 
te, senão como epifenômeno de sequências de linhas em derivações de pro- 
vas matemáticas! /'s, 


A GC assume um modelo monostrático de gramática. Isto significa que há 
apenas um nível de representação sintática, a saber: a estrutura de superficie. 
Logo, a GC dispensa categorias vazias como vestígios e elementos pronominais 
vazios. Como não há diferentes níveis de representação, não há lugar para trans- 
formações. Além a GC não reconhece estruturas sintáticas como objetos 
autônomos da teoria linguística. Estruturas de constituintes emergem como es- 
truturas de provas numa derivação, mas elas são parte da nossa teorização sobre 
a linguagem, e não parte da própria linguagem. Logo, é impossível formular 
restrições [de boa formação] sobre objetos sintáticos que façam referência a 
noções como dominância, c-comando, m-comando, etc. 


A perspectiva ilustrada nas duas passagens acima poderia ser vista como 
algo presunçoso e acintoso, e poderia ser chamada de lexicocêntrica, se- 
manticocêntrica ou logicocêntrica, com conotação pejorativa. Aos olhos 
de um chomskyano, esta é apenas a hipótese contrária, que, na largada, é 
igualmente válida e coerente enquanto hipótese, com a mesma virtude de 
buscar simplificar o sistema global de níveis de representação”; mas que, 


15. O mesmo vale para Montague (1970a, 1970b), talvez de modo um pouco menos ra- 
dical, Como explicitam Halvorsen & Laduslaw (1979: 188): “Montague se interessava pela 
sintaxe apenas na medida em que ela fornece estruturas sentenciais a partir das quais se 
constroem análises semânticas”, 


16. Remeto o leitor a McCawley (1981: 1-204), Gamut (1991: 28-113) e Partee et al. (1993: 
87-178) para ótimas explicações das bases da lógica proposicional e da lógica de predicados, 
em que são cruciais as noções de prova, cálculo proposicional, modus ponens, modus tollens, 
tradução na metalíngua, etc. 


17.Cf. Chosmky (1951: 2-3; 1955a: 105-128; 1957: cap 6). 
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segundo a ótica chomskyana, revela-se ao final inferior em todos os níveis 
de adequação. 

Nas duas subseções seguintes, desenvolvo um pouco a posição sintetiza- 
da na passagem de Hornstein (1984) acima, segundo a qual o significado é 
extraído da própria sintaxe. Abordo dois dos aspectos relevantes para essa 
questão da codificação do significado na própria estrutura sintática. O pri- 
meiro (cf. $4,4.2) diz respeito a propriedades tradicionalmente concebidas 
como codificadas em DS, e que, a partir do PM, passaram a ser compreen- 
didas como codificadas em LF. O segundo (cf. $4.4.3) diz respeito a pro- 
priedades que já foram tidas como codificadas em DS, depois em SS, e que, 
a partir da TRL, serviram de argumento a favor da existência do terceiro 
nível sintático, LF. Embora, na visão hegemônica atual, ambos os tipos de 
fenômeno sejam compreendidos em termos de LF, o segundo deles requer 
transformações, enquanto o primeiro é sintagmático por natureza. 


54,4.2. Papéis temáticos 


Observemos agora alguns fatos bem elementares sobre o significado de 
expressões sintáticas resultantes da combinatória de ILs, mas que escon- 
dem em si propriedades não triviais que corroboram o sintaticocentrismo; 
e são abordadas na GGT pela Teoria Temática (cf. Chomsky 1981a: 34-48, 
101-127, et seq.)"*. Consideremos (19), (20), (21) e (22): 


(19) Choveu. 

(20a) Ana dançou. (20b) Ana soluçou. (20c) Ana delirou. (20d) Ana morreu. 
(21a) Ana beijou Edu. (21b) Ana amou Edu. 

(22a) Ana doou dinheiro para Edu. (22b) Ana colocou a carta na gaveta. 


18. Williams (1995) oferece uma ótima e acessível introdução panorâmica, sem banalizar 
questões complexas. Além disso, os bons manuais de GGT (cf. 1.1, n.2 ) costumam dedi- 
car um capítulo à Teoria Temática. 
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Em (19) temos o verbo chov-, que expressa um evento de chuva, Tal 
evento, por definição, não pressupõe nenhum participante. A chuva sim- 
plesmente acontece. Dizemos, então, que chov- é um verbo a-argumental, 
Nos exemplos em (20), temos quatro verbos cujo significado pressupõe a 
existência de um participante, sem o qual é impossível acontecer o evento 
descrito pelo verbo. Tais verbos são monoargumentais, pois demandam ser 
combinados com exatamente um sintagma, a que chamamos argumento, e 
que expressa o participante (do evento) cuja existência é pressuposta. Em 
(20), o único argumento de cada verbo é o DP Ana (ou NP, conforme as 
versões antigas), que se refere ao único participante do evento". Porém, o 
tipo de participação no evento é diferente em cada caso. No jargão da GGT, 
essa participação no evento é o papel temático”, também chamado de papel 
theta (frequentemente abreviado como papel-B, ou simplesmente 0). Há 
uma tipologia de papéis temáticos estabelecida, e que representa mais que 
uma mera convenção terminológica, mas sim uma concepção acerca da 
estrutura gramatical de uma parte do significado”. 

Em (20a), Ana é a agente da ação de dançar, há volição nesse ato, que 
por sinal pressupõe algo físico acontecendo. Em (20b), Ana não é agente, 
porque o soluço (também um evento físico) é involuntário (exceto em si- 
tuações atípicas, como uma atriz representando). Em (20c) temos algo bem 
semelhante, já que Ana não é agente do delírio, que também não é um ato 
voluntário, e, nesse caso, não é um evento físico, mas um estado psicoló- 


19. Nada impede que haja sintagmas adicionais expressando “informação extra” sobre o 


evento, e.g. Ana dançou (no salão), Ana soluçou (muito), Ana morreu (ontem) (afogada) 
(na praia). Estritamente falando, tais elementos não são “participantes! do evento no senti- 
do técnico. Esses são adjuntos, e não argumentos (cf. $3.2). 


20. Remeto o leitor a Carnie (2002: 168-173) para uma sucinta apresentação didática da 
diferença entre relações temáticas e papéis temáticos, que é importante, mas não necessária 
nesta breve seção introdutória ao tema. 

21. Ao iniciante, recomendo Perini (2008), que, apesar de volumoso, é leve quanto ao for- 
malismo, destacando-se pela farta ilustração dos pontos com fatos concretos do português. 
Lá o autor explica a noção de papel-f a partir da noção estruturalista de valência, de modo 
compatível com o quadro de Culicover & Jackendoff (2005). 
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gico. Diz-se que, em casos como (20c), Ana é a experienciadora do delírio. 
Pode-se, por analogia, dizer o mesmo sobre a relação entre Ana e o soluço 
em (20b), embora haja outras classificações, segundo as quais Ana seria 
paciente. A propósito, é como paciente que se classifica tradicionalmente 
o tipo de participação de Ana no evento de morrer em (20d). Esse último 
exemplo guarda semelhanças com estruturas na voz passiva (e.g. Edu foi 
beijado (por Ana)), nas quais o “objeto semântico" (prototipicamente um 
paciente) ocupa a posição de sujeito, e é com ele que o verbo concorda”, 

Em (21) temos dois verbos biargumentais, pois pressupõem dois partici- 
pantes, que, em ambos os casos, são instanciados pelos DPs Ana e Edu. Em 
(21a), Ana é a agente e Edu é o paciente da ação de beijar. Em (21b), Ana é 
a experienciadora do estado psicológico de amar, sendo Edu a causa, ainda 
que Edu possa talvez nem ter consciência de que Ana o amou, e nem ter 
feito nada com o propósito de ser amado. 

Verbos monoargumentais e biargumentais abundam no léxico das lín- 
guas. Há, também, em quantidade bem menor, verbos triargumentais, 
como em (22a)>, em que os DPs Ana e dinheiro e o PP para Edu instan- 
ciam os participantes previstos na definição do ato de doação, sendo-lhes 
atribuídos, respectivamente, os papéis temáticos de agente, paciente/tema 
e beneficiário/receptor/alvo. Em (22b) temos algo semelhante, sendo Ana, 
a carta e na gaveta os argumentos do verbo coloc-, que especifica a relação 
de alguém colocar algo em algum lugar. Verbos monoargumentais, biargu- 
mentais e triargumentais correspondem ao que gramáticos normativistas 


22. Elaborações sobre esse tópico ultrapassariam o escopo desta subseção. Por ora, limi- 
to-me a dizer que, nos termos da GGT, haveria ao menos dois tipos de verbos monoar- 
gumentais: os propriamente intransitivos, cujo argumento é externo (irmão de Vº) e os 
chamados ergativos ou inacusativos, cujo argumento é interno (irmão de V). Similarmente 
ao que ocorre em passivas, os verbos ergativos têm seus complementos alçados à posição 
de sujeito da sentença (i.e. especificador de IP). 

23. Prototipicamente, verbos triargumentais são variantes da ideia de transferência de posse 
(dar, receber, emprestar, devolver, etc.) ou de relocação (colocar, introduzir, extrair, retirar, 
etc.). Num nível de análise mais abstrato, pode-se dizer que a estrutura temática seria es- 
sencialmente a mesma se entendermos beneficiário e alvo/fonte como noções equivalentes. 
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classificam respectivamente como intransitivos, transitivos e bitransitivos. 
Ao que tudo indica, não há verbos com mais de três argumentos”, 

No jargão da teoria gramatical (não apenas na GGT), diz-se que todos 
os verbos discutidos acima são predicadores, que expressam um evento (ou 
estado), que pressupõe a existência de um certo número de participantes, 
os quais exercem certos papéis especificados pelo predicador, e que são ine- 
rentes à definição do evento/estado ali expresso. Chamamos de argumen- 
to a expressão linguística (tipicamente, um NP, ou, nas versões atuais, um 
DP) que manifesta morfossintaticamente cada participante. Cada DP, em si 
mesmo, não especifica seu papel temático, i.e. a natureza da sua participa- 
ção no evento/estado. Isto é determinado pelo predicador, que codifica em 
si os papéis temáticos a serem atribuídos aos argumentos. 

Mas cada DP argumento especifica a identidade do ente que exerce tal 
papel atribuído pelo predicador. É comum, no jargão dos semanticistas, 
chamar os predicadores mono, bi e triargumentais de predicadores de 
um lugar, de dois lugares e de três lugares, respectivamente (predicado- 
res a-argumentais seriam predicadores monádicos). A ideia central — não 
exclusiva da GGT, pois também norteia análises na SM — é que todos os 
“lugares” previstos devem ser preenchidos na sintaxe (no jargão da SM, 
todos os lugares devem ser saturados), e nenhum lugar novo deve ser cria- 
do na sintaxe (exceto pela adição ilimitada de adjuntos, que são semân- 
tica e sintaticamente distintos de argumentos). Na prática, isso implica 
que um predicador demanda a presença dos argumentos que ele prevê, 
não mais, não menos. Assim, por exemplo, se em vez de (22b) tivéssemos 
“Ana colocou, teríamos um dado agramatical, pois faltam argumentos 
previstos pelo predicador. Nos termos da GGT, dois papéis temáticos per- 
maneceram não atribuídos no plano sintático. Analogamente, se em vez 


24. O verbo apost- (cf. também traduz- e transport-) é comumente citado como potencial 
exemplo de predicador quadriargumental (cf. Ana apostou mil reais com Edu que Rita 


morreu). Contudo, testes apontam que, nesses casos, ao menos um dos supostos argumen- 
tos seria de fato um adjunto (cf. Calvin & Bickerton 2000: 265). 
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de (20b) tivéssemos *Ana soluçou Edu, teríamos um dado negativo pelo 
motivo inverso: há um DP extra para o qual não há papel temático a ser 
atribuído pelo verbo”. 

Ao longo desta subseção, continuarei a exemplificar predicadores e ar- 
gumentos a partir de estruturas nucleadas por um verbo. Saliento, porém, 
que outras categorias (nomes, adjetivos, até mesmo preposições) podem 
ser predicadores com papéis-O para atribuir a seus argumentos. Como 
já posto em $3,6, isso é algo bem estabelecido na GGT desde Chomsky 


(1970a), através de paralelos entre exemplos como Os inimigos destruíram 
acidade e a destruição da cidade pelos inimigos. Embora haja algumas va- 


riações relevantes em relação à estrutura temática de diferentes categorias 
de predicadores, é possível detectar um padrão geral, que se observa de 
modo mais claro em estruturas verbais como em (20), (21) e (22). Confor- 
me a Teoria Temática, esses padrões seriam consequência do Critério Theta, 
originalmente formulado por Chomsky (1981a: 36) como em (23)*. 


(23) Critério Theta 
A todo DP argumento deve ser atribuído exatamente um papel-8; e todo 
papel-O intrínseco a um predicador deve ser atribuído a exatamente um 
DP argumento. 


25. De acordo com os princípios da GGT, esse dado apresentaria ainda o outro problema 
de violação do Filtro de Caso, pois todo DP argumento, além de ter papel temático, teria de 
ter caso, o que não se aplica a Edu. 
26. Em uma das vertentes do PM, o princípio em (23) foi significativamente repensado, a 
partir dos trabalhos de Hornstein (1999, 2001, et seq.), de modo que, embora cada papel-O 
de um predicador deva ser atribuído a exatamente um DP argumento, seria possível haver 
casos em que um único DP argumento recebe múltiplos papéis-9, de múltiplos predicado- 
res. Isso está intimamente atrelado à ideia minimalista de que não existe DS, e o Critério 
Theta se aplica em LE. Assim, um DP pode se mover ao longo da derivação, tendo cópias de 
si mesmo em várias posições, e nada impediria que duas ou mais dessas posições sejam po- 
sições argumentais, e que, em LF, todos os papéis- sejam “reconhecidos: Sentenças como 
ir são exemplos canônicos disso (nesse caso, Ana é simultaneamente 
argumento de quer e de dormir). Recomendo Hornstein & Polinsky (2010) e Boecks et al. 
(2010) para uma visão plena dessa reconcepção da Teoria Temática. 
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De acordo com os postulados da TRL, o princípio em (23) seria um 
filtro de boa formação de estruturas sintáticas a ser obedecido no nível de 
representação DS, no qual todo DP argumento deve ocupar uma (e apenas 
uma) posição temática, i.e. deve ser irmão de uma projeção de um núcleo 
predicador que tenha papel-0 a lhe atribuir. Nos casos em (20) e (21), tais 
posições seriam as de irmão de V e/ou irmão de V? a depender do verbo. 
Comentarei adiante casos como (22), um tanto mais complexos. Além dis- 
so, tal filtro proíbe, que, em DS, haja, por exemplo, um verbo biargumental 
em que ao menos uma das duas posições temáticas de seu esqueleto X-Bar- 
ra (i.e. complemento e especificador) está vazia, ou ocupada por algo que 
não pode receber papel-Q (e.g. um advérbio). No modelo da TRL, qualquer 
rearranjo da estrutura entre DS e SS que venha a 'corrigir' problemas desse 
tipo é incapaz de 'reverter a agramaticalidade, pois seria “tarde demais, já 
que o filtro se aplica em DS”. 

Na prática, esse requerimento de o predicador vir necessariamente 
acompanhado de todos e apenas os argumentos que ele prevê se mostra 
bem mais complexo, aliás, verificando-se de modo mais transparente ou 
menos, a depender da língua. Primeiramente, em línguas como o por- 
tuguês, por uma série de razões atreladas a outros aspectos gramaticais, 
abundam casos de DPs que são categorias vazias (i.e. elipse ou “pronomes 


silenciosos"). Logo, em circunstâncias muito específicas em que certas in- 


27. Ilustro a lógica de (23) com uma analogia. Na montagem de uma peça de teatro, feita de 
modo convencional, o texto narra um acontecimento (e.g. um assassinato), que pressupõe 
personagens participantes, cada uma delas exercendo um papel na história (i.e. o assassino, 
a vítima, a testemunha, o investigador, etc.). Canonicamente, o diretor atribui cada papel 
(representação de uma personagem) a um único ator; e atribui a cada ator um único papel. 
Não pode haver personagem sem ator para representá-la (a menos que ela esteja presente 
apenas no discurso das outras personagens, como “o falecido avô da vitima"); nem ator 
representando múltiplas personagens; nem personagem representada por múltiplos atores 
(exceto quando se trata de retratar a mesma personagem quando criança, adulta e idosa); 
tampouco um ator presente no palco sem representar personagem alguma. Essa analogia se 
quebra no caso de montagens não canônicas, como no “teatro de vanguarda”. 
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formações estão salientes no discurso (por exemplo, logo após a pergunta 
“Por que aquele carro não está mais na vitrine da loja?”), é possível que 
Aline vendeu seja uma sentença bem-formada, a despeito de vend- ser um 
predicador biargumental e aparentemente haver apenas um argumento. 
No nível de abstração relevante (a estrutura profunda, se nos basearmos 
no modelo TRL), haveria, sim, um segundo argumento presente, um com- 
plemento de vend- (seja um “pronome silencioso; seja o DP o carro, elidido 
no plano fonológico). Afinal, a sentença é de fato interpretada como se 
referindo à venda do carro por parte de Aline. Em línguas como o inglês, 
estruturas com “argumentos silenciosos são muito mais raras e restritas 
a circunstâncias mais especiais, em virtude da ação de outros requisitos 
da gramática em questão. Há outros casos parecidos com este, porém dis- 
tintos nos detalhes. Por exemplo, Edu já comeu é uma sentença legítima 
mesmo em contextos nos quais não há nenhuma informação sobre comida 
saliente no discurso (e.g. “Cadê aquela romã que estava na geladeira?”). 
Entende-se, nesses casos, que Edu se alimentou, fez uma refeição. É interes- 
sante notar que se subentende que a coisa comida seja algo 'canonicamente 
comível! Ou seja, tanto Edu comeu romã como Edu comeu papel são sen- 
tenças bem-formadas; a primeira expressa algo corriqueiro, mas a segunda 
é pragmaticamente excepcional por expressar algo que é estranho, embora 
possa ser feito e possa ser descrito através da segunda sentença. Quando di- 
zemos Edu já comeu num contexto desprovido de informações adicionais 
sobre o que poderia ter sido comido, a única interpretação possível é que 
Edu comeu algo como romã, maçã, pão, pizza, bolo, peixe, etc.; e não algo 
inesperado, como papel, areia, esparadrapo, moedas, etc. 

A representação sintática desse argumento implícito é uma questão mui- 
to debatida e sem conclusões definitivas. Dados desse tipo se aproximam 
do que poderíamos descrever como “uso intransitivo de verbo transitivo” o 


que pode talvez legitimar a postulação de dois (ou mais) ILs distintos para 
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o que parece ser 'o mesmo verbo) Interessantemente, em línguas como o 
inglés, em que o equivalente de Aline vendeu é claramente agramatical (se- 
ria necessário minimamente um pronome explícito na posição de objeto 
para legitimar a estrutura), sentenças como She drinks (equivalente a Ela 
bebe) são lugar-comum em contextos sem informação prévia (nesse caso, 
exibindo a propriedade de que a coisa bebida é necessariamente uma bebi- 
da alcoólica, como também verificamos em português). A seguir, vejamos 
O caso inverso disso. 

Verbos intransitivos podem eventualmente ter um “uso transitivo, como 
em Ana dançou valsa. A análise desses casos envolve uma discussão comple- 
xa que não cabe aqui. Pode-se pensar que tais verbos seriam intrinsecamente 
biargumentais, e que seus “usos intransitivos” se assemelhariam a casos como 
Ela bebe, mencionado acima. Pode-se pensar que há dois ILs distintos para 
danç- (e muitos outros verbos), entre outras hipóteses. Por fim, há casos 


como Ana dormiu um sono profundo, em que o verbo dorm», tradicional- 


mente classificado como intransitivo, estaria sendo usado transitivamente. 


Note-se, porém, que, em tais estruturas, o suposto “segundo argumento; é, 
em realidade, um veículo para uma informação extra que não é demandada 
pela estrutura temática do predicador. O fato de que a sentença em questão 
é parafraseável como Ana dormiu profundamente sugere fortemente que 
um sono é um pseudoargumento, comumente chamado de “objeto cogna- 
to; que sempre traz informação redundante já presente no verbo, só sendo 
licenciado se vier acrescido de alguma informação extra com o efeito de um 
modificador adverbial. Seria necessário precisar como se dá a representação 
morfossintática desse “adjunto disfarçado de argumento: 

Em suma, há aspectos claros e robustos do fenômeno geral das relações 
temáticas, assim como aspectos nebulosos e difíceis de serem capturados 
por um simples formalismo que pressupõe que cada predicador possui ine- 


rentemente um determinado número de papéis temáticos de certos tipos, a 
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serem atribuídos, na sintaxe, a argumentos, presentes na exata quantidade 
dos papéis temáticos previstos pelo predicador. Saliento, porém, que tais 
desafios se colocam, em maior ou menor grau, para qualquer outra abor- 
dagem teórica (cf. Dixon & Aikhenvald (2000) para outras visões sobre 
“transitividade flexível"). É inescapável postular propriedades internas aos 
ILs e requerimentos de boa formação de estruturas sintáticas e mecanis- 
mos para interpretá-las. Fazer a conta fechar é difícil em qualquer teoria. 

Até aqui, temos evidências sólidas de que diferentes ILs seriam intrin- 
secamente dotados com certos papéis temáticos a serem atribuídos a sin- 
tagmas (tipicamente DPs) com os quais eles se combinam localmente. Ou 
seja, o caráter mono, bi ou triargumental de cada verbo — bem como os 
papéis temáticos exatos que ele atribui a seu(s) argumento(s) — seria codi- 
ficado no IL predicador em si, cabendo à sintaxe simplesmente “projetar” 
esse IL num esqueleto X-Barra em cujas 'vagas' (i.e. complemento e espe- 
cificador) os argumentos seriam encaixados. De fato, algo mais ou menos 
nessa linha parece inescapável. Entretanto, a Teoria Temática prevê que o 
papel da sintaxe seja um pouco maior que esse. Ilustro isso a partir do sim- 
ples exemplo em (21a). Em Ana beijou Edu, temos em beij- um predicador 
biargumental, que prevê um argumento agente (quem beija) e um argu- 
mento paciente (quem é beijado). Essas propriedades não são previsíveis 
pela estrutura sintática. Trata-se de idiossincrasias desse verbo particular, 
que devem, portanto, ser tidas como codificadas no IL. Porém, há uma 
regularidade quanto ao “mapeamento sintático” desses papéis temáticos. O 
dado em questão tem necessariamente a estrutura em (24a); não a estru- 
tura em (24b)”, 


28. Em ambos os casos, o DP que recebe o papel-8 de agente encontra-se na posição de 
especificador de IP em SS. Contudo, a posição relevante para recebimento de papel-O é 
aquela dentro do domínio local do VP, estabelecida no estágio derivacional anterior, em 
DS, e indicada em (24) através dos vestígios. 
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estrutura superficial estrutura superficial 
(24) | IP (abstraindo a camada CP) (24b) IP (abstraindo a camada CP) 
SS, A 


Note que (24b) também é uma sentença legitima, mas significa algo dis- 
tinto de (24a). Em (24a), Ana é agente e Edu paciente da ação de beijar. Em 
(24b), ocorre o contrário. Ou seja, em DS, o argumento que recebe o papel 
de paciente ocupa a posição mais local de irmão de V, uma posição mais 
“interna, compondo com o verbo a unidade sintática Vº; ao passo que o 
argumento que recebe o papel de agente deve ser mais 'externo; ocupando 
a posição de irmão de Vº em DS. Ambos os argumentos estão próximos ao 
verbo e são irmãos de uma das projeções de V no “esqueleto X-Barra. O 
argumento externo c-comanda o interno, mas o inverso não é verdadeiro. 
Isso é um padrão sintático, não semântico; e extrapola esse verbo especi- 
fico, aplicando-se a todo verbo que preveja um argumento agente e outro 
paciente, como se pode verificar, por exemplo, em Ana espancou Edu, Ana 
beijou Edu, Ana tatuou Edu, Ana algemou Edu, etc. Nesse contexto é opor- 


tuno observarmos o jabberwocky em (25). 
(25) Ana glimbrou Edu. 

O que isso significa? Não sabemos, exceto parcialmente. E esse conheci- 
mento parcial é sintático. Temos o verbo glimbr- de significado desconhe- 


cido. Mas nosso conhecimento sintático nos permite inferir com segurança 
que se trata de um predicador biargumental. (25) expressa um evento de 
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“glimbração” ocorrido no passado, sendo Ana e Edu os participantes. Mas 
qual seria o tipo de participação de Ana e Edu nesse evento? Em outras 
palavras, quais são os papéis temáticos dos DPs Ana e Edu em (25)? Não te- 
mos como saber ao certo. Talvez glimbr- signifique um ato que uma pessoa 
pratica afetando o corpo da outra (uma forma de carícia ou de agressão, 
por exemplo). Nesse caso, Ana seria agente e Edu paciente. Talvez glimbr- 
signifique o estado psicológico de alguém diante de um ato, ou da sim- 
ples presença ou da mera existência de outra pessoa. Nesse caso, Ana seria 
experienciadora, e Edu seria a causa. Outras possibilidades existem nessa 
questão em aberto. 

Contudo, mesmo desconhecendo o significado de glimbr- e quais dois 
papéis temáticos esse verbo impõe a seus argumentos, temos convicção 
absoluta da impossibilidade de certas distribuições dos papéis temáticos 
na estrutura sintática. Sabemos com certeza que (25) não significa que 
Edu é o agente e Ana a paciente da glimbração. Sabemos também que Edu 
não seria o experienciador e Ana o tema/causa. Isso não é conhecimento 
lexical nem semântico; é conhecimento sintático. Podemos inventar no- 
vos verbos à vontade, assim como podemos repetidamente nos deparar 
com verbos que nos são até então desconhecidos mas que já existem (na 
Língua-E), e tentamos inferir seus significados a partir do contexto. Po- 
rém, em nenhuma das duas situações jamais sequer cogitamos estrutu- 
ras temáticas “invertidas” como as que acabo de mencionar. Isso significa 
que, embora o número e o tipo de papéis temáticos seja uma proprieda- 
de intrínseca do IL predicador, a sua distribuição na estrutura sintática 
é controlada pela própria sintaxe, que manipula tais papéis atribuindo a 
cada um seu devido lugar na estrutura. Para que isso seja possível, a noção 
de papel temático não pode ser exclusivamente lexicossemântica. Deve 
ter uma ontologia passível de ser reconhecida e manipulada pela sintaxe 
como uma entidade ao menos parcialmente sintática. Esse é um ponto de 
forte divergência entre a GGT e as abordagens calcadas na SM, nas quais 
o IL predicador já codifica em si qual dos argumentos é interno ou exter- 
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no. Pesa sobre tais abordagens o desafio de explicar, entre outras coisas, o 
porquê da inexistência das estruturas temáticas “invertidas” e o porquê de 
sabermos disso diante de novos predicadores. 

De acordo com a visão sintaticocêntrica da GGT, é a sintaxe que define 
qual argumento é interno ou externo, com base na chamada Hierarquia 
Temática (HT), que seria um princípio universal da sintaxe, a ser obede- 
cido no nível de representação relevante (DS no sistema da TRL, e LF no 
sistema do PM, cf. $4.3). A concepção geral por trás da hierarquia temática 
tem origem fora das versões hegemônicas da GGT, mais precisamente no 
clássico e influentíssimo trabalho de Fillmore (1968, 1977) em que a ideia 
central era implementada em termos das noções de molde de casos, hierar- 
quia de casos, princípios de seleção do sujeito, e centralidade da sintaxe (esta 
última, claramente sintaticocêntrica!). Na GGT, a HT contou com várias 
versões, todas muito parecidas, mas diferindo em alguns poucos detalhes 
espinhosos (sobretudo quanto à posição do papel-O tema relativamente aos 
demais). Não cabe mencionar todas as suas versões e seus autores. Apenas 
credito Baker (1988: 46) pela primeira formulação do que ficou conhecido 
como a Hipótese da Uniformidade da Atribuição de Papel-Theta (cuja sigla 
original em inglês é UTAH). Adoto aqui a versão da HT em (26) para fins 


práticos, sem me comprometer com sua acurácia última. 
(26) agente > tema > experienciador > causa > paciente > fonte 5 alvo 


O esquema em (26) deve ser lido como uma espécie de “ordem de pre- 
ferência na fila, em que a 'fila” da esquerda para a direita aqui apresenta- 
da corresponderia, no mapeamento do léxico para a sintaxe, a outra 'fila' 
que dispõe os DPs aos quais tais papéis-O são atribuídos na ordem 
do mais c-comandante para o mais c-comandado (em outras palavras, do 
mais externo para o mais interno, ou do menos profundamente encaixa- 
do para o mais profundamente encaixado). Isso não implica que todos os 
papéis temáticos arrolados em (26) estejam presentes na projeção sintática 
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do predicador. Sejam quantos e quais forem os papéis-0, eles devem ser 
distribuídos no esqueleto X-Barra do predicador de modo a que um papel 
“mais à esquerda" em (26) seja atribuído a um DP que ocupe uma posição 
mais c-comandante/externa que aquela ocupada pelo DP ao qual é atribuí- 
do um papel “mais à direita” em (26)”. Em (27) e (28) há dois exemplos de 
distribuições possíveis e impossíveis: 


(274) Y vP (7%) vp (8a) vp (28b)* VP 
cê A E Edi 
DP v DP v DP v DP v 
B-agente B-paciente Bexp 2 Ocausa MN 
v DP vo DP v DP vo DP 
beij- Opaciente  beij- O-agente am- Gcausa Im Gexp 


(26) é um axioma. Preferencialmente, gostaríamos de explicar o porquê 
de essa ser a ordem da 'fila. Porém, na medida em que os fatos corroboram 
essa ordem, reconhecemos que há algo na gramática que determina (26) 
como resultado. Num primeiro momento, o que se pode fazer então é as- 
sumir (26) como um princípio do sistema e buscar refiná-lo face a novos 
dados empíricos. Em (29), temos exemplos de dados que corroboram o 
esquema em (26): 


(294) Ana, o beijou Edu, q (=(21a)) 
(29) Ana into AMOU Edu (=(21b)) 
(290) Oassaltante, (assustou Akemi iu) 

(29d) Aescuridão, assustou Akemi ins er 

(29e) Ocarteiro entregou a encomenda | [para o comprador, 
(298) -Ocriminoso,, invadiu a prefeitura, ,,, 

(299) Ocriminoso,,.., fugiu da cadeia 


29. Remeto o leitor a Bowerman (1990) para uma crítica a essa concepção de interface 
entre a semântica lexical e a estrutura sintática, com contraexemplos desafiadores tanto no 
plano da adequação descritiva como no da adequação explicativa. Argumentos adicionais 
encontram-se em Bowerman & Brown (2008) e obras lá citadas. 
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(29h) Aestátua | já saiu do aeroporto , |. 
(29) Aestátua,, já chegou no museu, 

(29) Aventania derrubou o andarilho 
(29k) Aagressora |, derrubou o andarilho 


Hpacente) 


Antes de abordar os verbos triargumentais, cabem mais umas observa- 
ções sobre a distribuição de papéis-O atribuídos por verbos mono e biargu- 
mentais. Considere os dados em (30), que adaptei a partir de exemplos de 
Mioto et al. (2013: 131): 


(30a) Akemi [pegou [o livro] (na estante)] (30b) Akemi [pegou [um resfriado]] 
(30c) Akemi [pegou [nojo] (da vizinha)] | (30d) Akemi [pegou [no batente)] 


Como já dito antes, não se pode descartar a priori a possibilidade de 
haver múltiplos verbos distintos, porém homófonos. Entretanto, é preci- 
so sempre ter muita cautela ao postularmos tais homonímias, sob o ris- 
co de forjarmos uma pseudossolução que nada explica, configurando-se 
num Mapa de Borges. Tanto pior se tivermos de fazer isso para muitíssimos 
predicadores. Ao olharmos para (30) com atenção, notamos que há outro 
caminho mais promissor e mais sintaticocêntrico. Partindo da premissa de 
que temos o mesmo verbo nos quatro exemplos, esperaríamos que o pa- 
pel-B do DP sujeito, Akemi, fosse o mesmo em todos os casos. Mas ocorre 
que seu papel-Q varia de acordo com o complemento do verbo. Ou seja, 
Akemi é agente em (30a), paciente em (30b), e experienciador em (30c). Em 
(30d), Akemi também é agente, mas a construção, como um todo, tem uma 
estrutura de significado excepcional em relação aos dados anteriores. Não 
se trata de um evento em que houve um batente no qual Akemi tocou suas 
mãos. Trata-se, antes, de um evento em que Akemi trabalhou com muita 
dedicação e esforço. Logo, (30d) é uma expressão idiomática, e seu signifi- 
cado não é composicional, não resulta simplesmente da combinação dos 
significados das partes. É uma unidade sintática complexa com um sentido 
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figurado que é fixo, como se tivesse sido lexicalizado. Mas como pode esse 
significado estar no léxico se ele é atribuído a uma unidade complexa que 
teria sido construída na sintaxe? Aqui começamos a perceber que a intera- 
ção entre léxico e sintaxe se dá de modo a corroborar o sintaticocentrismo. 

Para dar conta de paradigmas como (30), uma hipótese bastante ex- 
plorada da GGT é que o papel-O do argumento externo não é totalmen- 
te determinado pelo predicador, tal como especificado no léxico. Haveria 
uma contribuição da sintaxe, na medida em que o argumento externo (que 
é irmão de V”) tem seu papel-O definido pelo seu constituinte irmão V), 
não por V. A combinação entre V e seu complemento seria processada pelo 
componente interpretativo relevante conforme as idiossincrasias de signi- 
ficado de ambos, definindo assim o “perfil temático” de V”, que atribuiria o 
papel-0 do argumento externo, obedecendo à Hierarquia Temática. Qual é 
a relevância de expressões idiomáticas como (30d) nisso tudo? 

O forte indício de que o papel-O do argumento externo é atribuído por 
Vº aponta na direção de que é correta, enfim, a visão tradicional sobre a 
sequência sujeito'verbo"objeto ser estruturada como [sujeito"[ verbo” 
objeto]), e não como [[sujeito"verbo]"objeto]), ou sem agrupamentos in- 
ternos. Eis, portanto, o início de uma resposta ao questionamento levanta- 
do em $3.1, n. 4. Além disso, expressões idiomáticas como (30d) também 
constituem evidência em favor da estrutura [sujeito”[verbo"objeto]] e 
contra as alternativas. Existem expressões idiomáticas de vários tipos, mas 
todas elas têm em comum o fato de envolverem a atribuição de um signifi- 
cado arbitrário (não composicional) a uma subsequência de ILs que corres- 
ponde a um constituinte, i.e. que é dominada por um nódulo não terminal. 
Para tanto, é preciso que tal constituinte exista, incluindo integralmente a 
subsequência em questão e excluindo todo o resto da sequência terminal. 
Há expressões idiomáticas correspondentes a DPs (e.g. a ponta do iceberg, 
0 cocô do cavalo do bandido, a última bolacha do pacote), a Ns (e.g. bom- 
ba, cavalo, anjo), a As (e.g. quente, divino, torto), a PPs (e.g. dos infernos, 
com uma mão na frente e outra atrás, no buraco), e a vários outros tipos 
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de constituinte. Embora sintagmas complexos sejam, por definição, cons- 
truídos na sintaxe, nada impede que uns tantos deles, de tão recorrentes 
que são, passem a ser memorizados como unidades reutilizáveis, algo como 
“palavras gigantes” resultantes de um feedback da sintaxe, e que ficam guar- 
dadas em alguma “gaveta” especial do léxico mental. Assim sendo, é possível 
que a essas “palavras gigantes” possa ser atribuído um significado novo, não 
literal, ao sabor da situação pragmática que consagrou aquele uso (o que, 
no limite, não seria nada além da arbitrariedade saussureana). 

Atendo-nos aos constituintes verbais, nota-se que há vários subtipos. 
Verbos como detonar, engolir e arrebentar, por exemplo, podem ser usados 
com quaisquer sujeitos e objetos para significar algo como “derrotar, sub- 
julgar, constranger, desmascarar” (Ópa, desmascarar também é um idio- 
matismo!). Crucialmente, em exemplos como Jerry Fodor detonou Hilary 
Putnam, o sujeito e o objeto não são interpretados com sentido figurado, 
mas o verbo sim. Em exemplos como A vaca foi pro brejo e A porca torceu 
o rabo, não há dúvida de que o VP inteiro foi idiomatizado, pois sujeito, 
verbo e objeto estão todos sendo usados em um sentido figurado específico 
que só existe na combinação dos três elementos”. Existem idiomatismos 
envolvendo apenas sujeito e verbo, como O bicho pegou, e O galo cantou. 
Note que, nesses casos, não há objeto no idiomatismo, nem é possível in- 
serir um sem que se perca a interpretação idiomática”. Logo, tudo indica 
que esses exemplos também envolvem idiomatização do VP inteiro, cujo 
núcleo é monoargumental. 

Mais interessantes são os idiomatismos que envolvem o verbo e o objeto, 
que, juntos, têm sentido figurado, tal que qualquer sujeito pode ser com- 
binado a esse idiomatismo, sendo no entanto interpretado de modo ca- 
nônico, não participando, portanto, do idiomatismo. É isso que temos em 


30. Dados como A vaca já tinha ido pro brejo na semana passada evidenciam que os idio- 
matismos em questão afetam um VP, e não um IP/CP inteiro, pois é possível variar a mor- 
fologia verbal, adjuntos, etc. 


31. Cf. O bicho pegou você e O galo cantou 'Ando Meio Desligado! 
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no ventilador, etc. A lista é gigantesca, e frequentemente alguém inventa 
uma nova gíria com essa anatomia interna. Temos aí evidência de que exis- 
te uma unidade Vº que inclui verbo e complemento e exclui um sujeito. 
Assim como outras unidades, V' também é idiomatizável. Mais interessante 
ainda é o fato de não existirem idiomatismos envolvendo a subsequência 
sujeito'verbo numa sentença que contenha um objeto genuíno. Imagine- 
mos um dialeto hipotético em que A polícia prendeu Edu significasse que 
Edu foi flagrado fazendo algo que dizia que jamais faria, e que ele se sente 
constrangido pelo flagra. Não há nada absurdo semântica ou pragmati- 
camente nisso. Entretanto, idiomatismos desse tipo não são atestados em 
língua nenhuma”. É exatamente isso que se espera se a anatomia interna 
do VP for [sujeito'[verbo"objeto]], pois assim não tem como haver uma 
unidade que englobe sujeito e verbo e exclua o objeto”. Inexistindo tal uni- 
dade, também inexistem idiomatizações dela”. 

E quanto aos verbos triargumentais? Aparentemente, dado o que foi dito 
até aqui, seria uma simples questão de distribuir os três papéis-O (quais- 


32. Há dados que, à primeira vista, parecem contradizer essa generalização, mas que um 
exame mais minucioso revela não serem contraexemplos genuínos. Um deles é a expressão 
“ninguém merece”, que pode ser combinada com qualquer objeto. De fato, trata-se de uma 
“gíria recorrente, mas note-se que seu significado não é idiomático. Outro exemplo seria 
“Um passarinho verde me contou [...]”, em que qualquer oração subordinada objetiva direta 
pode ser complemento de contou. Porém, apenas o DP um passarinho verde está de fato 
idiomatizado, referindo-se a um fofoqueiro de identidade misteriosa, 

33. Dryer (1992, 2005), principal estudo tipológico sobre o assunto, mostra que, entre 1056 
línguas observadas, 497 são SOV (i.e. sujeito” objeto verbo) e 435 são SVO (i.e. sujeito” 
verbo"objeto), somando 88% do total, contra 12% da soma das ordens VSO, VOS, OVS 
e OSV em 126 línguas, evidenciando que essas últimas ordens são padrões derivados de 
combinações de movimentos enquanto as duas primeiras seriam mais básicas (cf. também 
Kayne 1994: 35-36). Isso reforça a tese de que há uma unidade [V"O] ou [O"V] indepen- 
dente do sujeito. 


34. Aqui, é importante mencionar que o formalismo da Gramática Categorial permite uma 
“lexibilidade de constituência;, por assim dizer, no qual tanto [[sujeitoverbo] objeto) 
como [sujeito” [verbo'objeto]] podem ser agrupamentos possíveis. O padrão de idioma- 
tismos visto acima desafia seriamente tal modelo. 
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quer que eles sejam) na estrutura sintática em obediência à HT em (26). O 
problema, no entanto, é que isso não é nada trivial posto que o 'esqueleto” 
do VP disporia apenas de duas posições internas a ele e que são irmãs de 
uma projeção de V: o complemento (irmão de V) e o especificador (irmão 
de V”). Embora isso tenha a vantagem de muito facilmente explicar a ine- 
xistência de verbos poliargumentais, há o problema de prever que verbos 
triargumentais não deveriam existir, dada a inexistência de uma terceira 
posição argumental no VP. Há uma vasta literatura técnica sobre o assunto, 
e, segundo a posição majoritária, o esqueleto do VP seria um pouco mais 
complexo do que apresentei até aqui, pois haveria dois núcleos verbais (i.e. 
Ve v) que se articulariam numa “concha” em que VP (que disponibiliza 
duas posições argumentais internas) é complemento de v, que se projeta 
em vP, cujo especificador abrigaria o argumento externo (cf. Larson 1988, 
1990; Hale & Keyser 1993; Chomsky 1995a; Kratzer 1996). Para efeitos des- 
ta introdução, adoto uma versão (substancialmente) modificada da análise 
proposta por den Dikken (1995: 121-123; 2006: 20-22). Tomemos, então, os 
dados em (31) e (32): 


(31) — Akira namora com Akemi. 
(32a) Akira deu flores para Akemi. (32b) Akira colocou moedas no bolso. 


Em (31a) temos um verbo biargumental que, no meu dialeto de referên- 
cia, é transitivo indireto, exigindo a presença da preposição com. Há dia- 
letos em que tal verbo é transitivo direto, sem a preposição, com o mesmo 
significado de (31), o que evidencia que, em (31), o recebedor do papel-O 
interno é o DP Akemi, não o PP com Akemi. Isso entra em choque com 
a premissa de que todo argumento deve ser irmão de uma projeção do 
predicador, pois, em (31), haveria projeções de P “no meio do caminho” 
entre o verbo e o DP complemento. Uma potencial solução advém dos tra- 
balhos em que se argumenta que, assim como os DPs, também os PPs são 
“projeções estendidas” dos NPs. Grosso modo, assim como a projeção verbal 
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“continua para além do próprio VP) com as camadas IP e CP acima dele; 
também teríamos no PP projetado logo acima do DP uma “continuação” do 
NP (cf. Grimshaw 1991; Frank 2002: cap 2). Desse modo, o PP do objeto 
indireto em (304) seria “transparente” para efeitos da transmissão do pa- 
pel-0 do verbo namor- ao DP Akemi, seu argumento interno. Se verdadei- 
ro, isso pode se estender para (32), cujos VPs seriam como em (33). 


(33a) vp (33b) vP 

GR Sea E 

DP v DP v 
2, do 

/ vo PP / Vo PP 

Akira do Akira coloc- 
De Pp DP P 
LN P DP à NP DP 


flores — para à moedas em à 


Akemi o bolso 


54.4.3. Operadores e variáveis 


Um simples caso concreto de interpretação na metalíngua traduzida en- 
contra-se no famoso exemplo em (34), para o qual existem as duas inter- 
pretações em (35a) e (35b), embora, como apontam Martin & Uriagereka 
(2008: 561-563), a segunda seja preferencial. 


35. Sob essa ótica, poderíamos diferenciar entre Ps genuínas (i.e. [-v-n]) e Ps “nominais” 
(ie. [-w+n]). As primeiras podem atribuir papel-6, etc; as segundas portam marcas mor- 
fológicas que expressam relações estabelecidas com outro núcleo com o qual se relacionam 
(e.g. note que a ideia de com já é prevista pelo próprio verbo, pois não se namora sozinho). 
Aliás, a própria natureza da regência começa a ser explicada por aí. Objetos indiretos não 
podem ser introduzidos por qualquer preposição, mas por aquela determinada pelo verbo, 
e que expressa morfologicamente ideias de localização (em), transferência de posse ou de 
lugar (de, para), companhia (com), etc., conforme o significado do verbo, e o papel-8 que 
ele impõe a seu argumento interno. 
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(34) | Todo homem ama uma mulher. 

(35a) Há um y tal que y é mulher, e é verdade que, para todo x tal que x é 
homem, x ama y. 

(35b) - Para todo x tal que x é homem, é verdade que há um y tal que y é muher, 
examay. 


A diferença essencial entre (35a) e (35b) é que, de acordo com (35a), há 
necessariamente uma única mulher amada por todos os diferentes homens; 
enquanto, de acordo com (35b), em princípio cada homem ama uma mu- 
lher diferente. Sob a ótica da SM, as leituras (35a) e (35b) não são obtidas 
diretamente a partir da estrutura sintática de (34), i.e. (36), mas sim a par- 
tir das estruturas extralinguísticas (37a) e (37b), respectivamente, que são 
ambas traduções possíveis da expressão de (36) numa metalíngua que 


serve de modelo. 


(36) | [*[*º todo homem] [9º ama [*º uma mulher]]] 
(37a) | [3y|y = mulher [Vx | x = homem [ama'(x,y)]]] 
(37b) | [Vx]x= homem [3y | y = mulher [ama'(x,y)]]] 


36. O caráter ambíguo de (34) não é tão óbvio quanto parece. Segundo Pietroski & 
Hornstein (2002), só há uma estrutura de LF possível nesse caso (cf. (45b) adiante), cor- 
respondente a (35b), em que todo homem tem escopo sobre uma mulher. Tal LF é distinta 
de (37a). Mesmo assim, (37b) é compatível com situações em que, coincidentemente, uma 
única mulher é amada por todos os homens. Conforme (37b), um enunciado de (34) é 
verdadeiro se e somente se, para cada um de todos os homens, houver alguma mulher tal 
que ele ama ela. No limite, pode ser que cada homem ame uma mulher diferente. No outro 
limite, pode ser que, coincidentemente, todos os homens amem a mesma mulher. Também 
pode ser que haja umas mulheres amadas por mais de um homem, outras sendo amadas 
por apenas um. O significado de (45b) é compatível com todas essas condições de verda- 
de. Ou seja, (45b), embora restrinja bastante o conjunto de interpretações possíveis, não 
especifica que as identidades de todas as mulheres amadas devam ser distintas ou iguais. 
Não haveria ambiguidade no plano gramatical, embora haja no plano discursivo. Remeto 
o leitor a Rothschild (2007: 926) para uma apresentação e discussão de contraexemplos que 
desafiam seriamente essa análise, razão pela qual assumo aqui a visão majoritária de que a 
ambiguidade é real e deriva de um par de duas estruturas distintas no nível LF, que tradi- 
cionalmente se assume serem algo aproximadamente como (454) e (45b) adiante. 
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Adotar essa abordagem implica propor e, mais que isso, justificar concei- 
tual e empiricamente a metalíngua que serve de modelo, bem como o siste- 
ma de tradução, cujos mecanismos específicos determinam quais estrutu- 
ras podem ou não podem ser traduções válidas para cada tipo de estrutura 
gramatical. Segundo Montague (1970a, 1970b, 1973), o sistema de tradução 
na metalíngua é uma gramática universal, que não se deve confundir com 
o que Chomsky chama pelo mesmo nome (cf. Havorsen & Ladusaw (1979) 
para um guia de leitura de Universal Grammar, de Montague (1970a)). Para 
Montague, a gramática universal não é uma entidade psicobiológica, mas 
sim um sistema lógico-matemático universal, que transcende línguas par- 
ticulares, bem como a biologia e as organizações sociais. Nas próprias pala- 
vras de Montague (1970a: 373): 


Não há [...] nenhuma diferença teórica relevante entre as línguas naturais e as 
linguagens artificiais dos lógicos; na verdade, pode-se compreender a sintaxe é 
a semântica dos dois tipos de linguagens por meio de uma única teoria, natural 
e matematicamente precisa. 


Até aí, não temos nada tão diferente da prática científica corrente, em que 
teorias são formuladas através de modelos matemáticos calcados em enti- 
dades abstratas cuja existência (no plano platônico das ideias) independe 
da natureza. Em última instância, os formalismos chomskyanos também 
fazem uso de ferramentas da matemática, cuja existência e justificativa 
transcendem o próprio objeto de estudo da GGT. Para evitar confusões, 
convenciono, nos limites deste livro, chamar de lógica transcendente essa 
concepção de gramática universal, cuja natureza Dowty (1979: 1) define 
muito bem: 


É importante ter em mente que Montague não conferiu ao termo gramática 
universal o sentido a ele costumeiramente atribuído pelos linguistas, segundo o 
qual o conceito se refere ao problema de caracterizar apenas a classe de línguas 
humanas possíveis. De fato, o autor deliberadamente objetivou formular uma 
teoria bem mais poderosa, capaz de caracterizar a sintaxe e a semântica de todas 
as conhecidas linguagens artificiais dos teóricos da lógica, bem como fazer o 
mesmo em relação às línguas naturais e, sem dúvida, em relação a inúmeras 
linguagens não naturais ainda sequer imaginadas. Por vezes é sugerido que essa 
propriedade do programa montagueano o torna totalmente irrelevante para os 
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propósitos dos linguistas, já que ele não faz “asserções empíricas” sobre a classe 
de línguas humanas possíveis. Embora eu concorde que o objetivo da Linguísti- 
ca seja caracterizar a classe mais estrita das línguas humanas possíveis, eu man- 
tenho a posição de que a gramática universal de Montague será, de fato, bastante 
útil para se atingir tal objetivo. Mas seu propósito não será o de servir como 
uma teoria linguística per se, mas como um quadro de referência no qual se vai 
formalizar, estudar e comparar várias teorias sobre línguas humanas possíveis. 


Como se pode depreender da passagem acima (de um autor monta- 
gueano), a séria questão que se coloca para os montagueanos é que a lógica 
transcendente, em si mesma, não proíbe, em princípio, a existência de di- 
versas estruturas semânticas não atestadas nas sentenças das línguas na- 
turais, como é o caso de violações de restrições de ilhas de extração (cf. 
$2.6)”. Se o sistema geral da gramática adotado for como na Gramática 
Categorial, em que a sintaxe praticamente não existe enquanto componen- 
te autônomo, então a agramaticalidade de certos dados semanticamente 
coerentes teria de ser concebida ou em termos das (im) possibilidades com- 
binatórias inerentes aos próprios ILs ou aos mecanismos de tradução para 
a metalíngua (i.e. certas sentenças seriam sintaticamente bem-formadas, 
mas seriam intraduzíveis para uma estrutura semântica e por isso não se- 
riam aceitas). Embora esse seja um caminho possível, nada disso é trivial, 
porque o suposto caráter universal da lógica transcendente não se verifica 
na prática, sendo necessário propor postulados estritamente linguísticos de 
uma forma ou de outra, e seriam eles, com suas idiossincrasias próprias da 
linguagem humana, os responsáveis pela agramaticalidade de certos dados 
não proibidos pela lógica transcendente. Acerca do fenômeno de quantifi- 
cação ilustrado em (34-35) e (36-37), Borges Neto (1996: 52-54) caracteriza 
as sentenças da metalíngua como em (38): 


(38a) [| [uma mulher, | [ [todo homem] [ama lela,] Hi 
(38b) | | [todo homem ] [ [ele ) | ama [uma mulher) ||) 


37. Cf. Larson & Segal (1995: 298-301) para outro tipo de fenômeno e uma discussão 
pertinente. 
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A seguir, o autor (op. cit.: 54) tece as seguintes considerações sobre a 

“tradução”: 
Certamente alguém poderia dizer que isso é um artifício técnico que existe ape- 
nas para que se obtenham as descrições estruturais adequadas para o proces- 
samento semântico, sem que se possa atribuir qualquer “naturalidade ou “rea- 
lidade psicológica! a esta regra. E eu certamente vou concordar, Montague não 
pretende que sua gramática tenha qualquer realidade psicológica, nem que suas 
regras sejam naturais. Para ele a língua é um objeto matemático e como tal deve 
ser tratada. 


Para além do confessado desinteresse por questões psicológicas, a passa- 
gem acima revela tacitamente que, na SM, a pretensão de que a gramática 
se segue de uma lógica transcendente esbarra no caráter arbitrário de pro- 
postas específicas de sistemas de tradução. Na GGT, na transição entre a 
Teoria Padrão Estendida e a TRL, com o advento do nível de Forma Lógica, 
consolidou-se a visão de que não há na gramática um componente semân- 
tico autônomo, com regras e princípios próprios que mapeariam a estru- 
tura sintática numa estrutura semântica distinta. Passou-se a conceber que 
o significado das sentenças está codificado na própria estrutura sintática, a 
saber: em LF. As regras e princípios pelos quais se obtém LF a partir de SS 
são essencialmente os mesmos pelos quais se obtém SS a partir de DS, e cuja 
postulação é independentemente motivada por razões puramente sintáticas. 

Antes de tratarmos do exemplo de quantificação posto acima, vejamos 
como a abordagem sintaticocêntrica para o significado funciona em um 
exemplo um pouco mais simples. Considere (39a) e sua estrutura sintática 
simplificada em (39b) sem os recursos da Teoria X-Barra, irrelevantes para 
nossos propósitos imediatos. Segundo a SM, (39b) teria um corresponden- 
te na metalíngua formal abstrata aproximadamente como (40): 


(39a) Ninguém gritou. (39b) [º [9 ninguém, ] [9 gritou,]] 


(40) Não existe uma pessoa x, tal que x gritou. 


38, De modo tecnicamente mais rigoroso, teríamos o seguinte: “3x [pessoa'(x)] | gri- 
tow (x). 
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Segundo a SM, a interpretação é feita a partir dessa expressão da metalín- 
gua traduzida em (40), não na expressão original em (39b) que foi tradu- 
zida. Na GGT, há algo equivalente a (40) nos aspectos relevantes, mas isso 
pertence à própria língua, não a uma metalingua. 

Primeiramente, assumamos que, em DS e em SS, ninguém é interna- 
mente estruturado como [Nº não alguém] e reorganizado morfofonologi- 
camente entre SS e PF — algo assumido também em análises não trans- 
formacionais. Posto que não alguém significa “nenhuma pessoa” (já que 
alguém = uma pessoa), se nada mais é postulado como característico da 
estrutura para além do que temos “na superfície” em (39) a menos que ape- 
lemos para uma metalíngua traduzida, então Ninguém gritou significaria 
que houve um ato de gritar, praticado por algo que não é uma pessoa. Isso 
certamente não corresponde a como de fato interpretamos a sentença. À 
proposta da GGT é que, entre SS e LF, o NP não alguém se move de sua po- 
sição original (deixando lá um “rastro marcado”) e se realoja na posição de 
irmão da S original, criando um novo constituinte S; que seria uma nova 
projeção de S (grosso modo, S = IP e S'= CP, em termos da Teoria X-Barra), 
tal como em (41). 


(4a) s (41b) s 
Dad aa 
NP vp => NP s 
e 1 AN aa 
DO o Da N Pi W 
não alguém gritou não alguém à | 
es v 
+ 1 i 
[RR 4 gritou 


O NP movido para fora de S traz a mesma “marca” que seu rastro dentro 
de S (ie. x). Isso possibilita que S seja uma “sentença aberta) na qual o t, 
na posição de sujeito equivale a um “pronome vinculado” (em termos 
técnicos, uma variável ligada) ao NP movido, que contém o operador não. 
Tal vinculação” decorre da “marca” x, subproduto da transformação de mo- 
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vimento. (41b) corresponde à estrutura da sentença no nível de represen- 
tação sintático de LF: a estrutura a ser interpretada via “leitura literal) apro- 
ximadamente nos moldes de (42). 


(42) s 


Não existe uma pessoa x, tal que 


O sintagma irmão de não especifica a classe dos elementos que não exis- 
tem. Diz-se, então, que alguém — argumento interno de não — é a restrição 
do operador. O sintagma irmão de não alguém especifica a situação em 
que nenhum elemento daquela classe existe (nenhum elemento da classe 
de pessoas existe na situação de ter gritado). Diz-se, então, que a sentença 
aberta t gritou — argumento externo de não — é o escopo do operador, o 
domínio no qual uma variável deve estar ligada a ele. A análise ora esboçada 
tem inspiração em propostas de teorias semânticas não transformacionais 
(cf. Montague 1973), como explicitamente admitido pelos primeiros de- 
senvolvedores da noção de Forma Lógica no âmbito da GGT (cf. Sag 1976; 
May 1977, inter alia); mas a implementação técnica e as consequências 
conceituais e empíricas são essencialmente chomskyanas e incompatíveis 
com os pressupostos da SM. Na SM, assume-se uma representação muito 
próxima disso, porém na metalíngua. Na GGT, assume-se que tudo esta- 
ria codificado na própria língua, na sintaxe. No final das contas, trata-se 
fundamentalmente de uma questão empírica (i.e. qual abordagem explica 
mais dos vários fenômenos de significado?), além de teórico-metodológica 
(i.e. qual abordagem os explica de modo mais simples, via recursos inde- 
pendentemente motivados da própria língua, e com menos apelo a noções 
externas postuladas somente para tal fim?). 


255 


Essa mesma análise pode ser aplicada a construções envolvendo sintag- 
mas quantificados (a rigor, ninguém é um quantificador que expressa a 
“quantidade zero” de pessoas) como em (34) acima, que é tradicionalmente 
analisado como sendo ambíguo, interpretável como (35a) ou (35b). Repito 
tais dados abaixo como (43), (44a) e (44b). 


(43) Todo homem ama uma mulher. 

(44a) Há um y tal que y é mulher, e é verdade que, para todo x tal que x é homem, 
x ama y. 

(44b) Para todo x tal que x é homem, é verdade que há um y tal que y é mulher, 
exama y. 


Na perspectiva da GGT, a obtenção das duas leituras em (44) em ter- 
mos puramente sintáticos se daria através de duas formas possíveis de 
se aplicar, entre SS e LF, a transformação de alçamento de quantificador 
(cf. May 1977, 1985) aos dois quantificadores da sentença, que seria uma 
demanda desencadeada pela própria natureza dos operadores envolvidos, 
que só são interpretáveis se houver variáveis ligadas a eles. Tais variáveis 
são obtidas via movimento, que cria vestígios. Os correlatos de (44a) e 
(44b) em LF seriam aproximadamente como em (45a) e (45b), respecti- 
vamente. Em ambos os casos, os dois quantificadores se movem de den- 
tro de IP e se adjungem a CP. A diferença está na ordem de aplicação 
desses movimentos. O quantificador que se move primeiro acaba ficando 
mais internamente encaixado na estrutura global, dentro do domínio que 
define o escopo do quantificador que se move depois e ocupa uma posi- 


ção mais 'externa””, 


39. O tipo exato de adjunção proposto por May difere do que se vê em (45) quanto a deta- 
lhes de implementação. Há algumas variantes da mesma ideia propostas na literatura téc- 
nica (e.g. adjunção a IP), que não alteram a essência do ponto central da presente discussão 
no nível de profundidade possível aqui. 
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(45a) cr (45b) cr 


= = 
DP, cp DP, cp 
A. A 
uma mulher DP, cr todo homem DP, cr 
| 
todo homem C” uma mulher C” 
AS Aa 
c IP Cc IP 
tamat, tamat, 


Conforme discussão anterior (cf. $3.3), saliento que (45a) e (45b) não 
são duas interpretações distintas para uma mesma sentença. São duas sen- 
tenças distintas que correspondem à mesma sequência terminal em (43). 
Nenhuma dessas duas estruturas é diretamente refletida na ordem de pro- 
núncia de ILs que elas efetivamente exibem no plano de PF (i.e. todo"ho- 
memama“uma“mulher). Isso condiz com a ideia de que tais movimentos 
ocorrem entre SS e LF, portanto, num estágio derivacional posterior ao 
ponto em que estruturas sintáticas são representáveis no plano fonológico. 
Interessantemente, em línguas como o húngaro, entre outras, observa-se 
que sentenças envolvendo quantificadores são sistematicamente interpre- 
tadas de modo único, sem ambiguidade, como se as relações de escopo 
fossem determinadas no nível de SS (cf. Kiss 1991). O entendimento geral é 
que o nível sintático relevante é universalmente LF, mesmo nessas línguas. 
Em algumas línguas o alçamento de quantificador ocorreria 'mais cedo” e 
em outras “mais tarde”, Essas línguas em que a fonologia reflete mais di- 
retamente a semântica dos quantificadores dão pistas valiosas acerca dos 
tipos de alçamento de quantificador possíveis, se há movimentos mais lon- 
gos (até CP), de média distância (até IP) ou mais curtos (até VP). 


40. CE. Fox & Nissenbaum (1999) para uma proposta minimalista de que, em todas as lín- 
guas, o alçamento de quantificador ocorre 'cedo', mas há variação quanto à cópia mais alta 
ser a que se pronuncia. 
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May (1985: 13) sumariza bem a essência dessa abordagem: 


A gramática fornece estrutura suficiente para que, em LF, a aplicação de quanti- 
ficações possa ser determinada de modo transparente [...] derivadas por mapea- 
mentos transformacionais, explorando a noção de variáveis logicamente ligadas 
que recebe sustentação gramatical através da teoria de vestígios. Note que tal 
mapeamento não é uma “tradução” entre as sentenças de uma dada língua e 
aquelas de um outro sistema de representação formal [de uma metalingua]. Ao 
contrário, eles são mapeamentos ocorridos inteiramente dentro do sistema de 
representação formal da linguagem natural, De fato, a assunção de que LF é de- 
rivada desse modo não demanda nenhum aparato adicional à teoria linguística 
que já não precise ser assumido de qualquer modo como parte da GU. [...] Logo, 
argumento que o mesmo aparato necessário para caracterizar apropriadamente 


as propriedades sintáticas de construções-QU (e.g. De quem Ângela suspeita?) 


é suficiente para caracterizar as propriedades sintáticas da representação em LF 


de Ângela suspeita de todos |...) sem a postulação de nenhum tipo especial de 
regras ou princípios. Esse ponto é importante e deve ser enfatizado. Assumir 
que há um nível de Forma Lógica derivado por “Mover 0º” não implica nenhu- 
ma ampliação do aparato formal da teoria linguística [...] embora haja o abar- 
camento de uma gama de fenômenos que, de outro modo, ficariam fora de seu 
alcance descritivo e explicativo. Na medida em que essa abordagem seja empiri- 
camente motivada, ela então representa a melhor alternativa disponível para se 
incorporar uma teoria de representação lógica à própria gramática. 

A obra de May (1985) é, com justiça, tomada como um marco inicial da 
concepção de gramática em que 'a semântica é toda feita pela própria sinta- 
xe, Entretanto, a ideia de Forma Lógica, articulada como um nível de repre- 
sentação interno à gramática que codifica relações de significado remete a 
Chomsky (1975b: 104-105), em suas reflexões em torno das consequências e 
evidências da noção de vestígio. Na formulação original, contudo, o que se 
postulava como operações gramaticais ocorrendo entre SS e LF eram “re- 
gras de interpretação semântica” de natureza distinta das transformações 
de movimento (e afins) do mapeamento entre DS e SS. Logo, não seria im- 
próprio dizer que, na sua incepção, LF foi concebida como uma estrutura 
semântica. O antecessor histórico imediato de May (1985) foi May (1977), 
tese de doutorado do autor (orientada por Chomsky) na qual LF já era 
concebida como construída por meios puramente sintáticos essencialmen- 
te indistintos daqueles que constroem S$; entretanto, naquele momento, 
May ainda concebia a existência de um nível de representação pós-sintático 
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responsável por codificar aspectos do significado até então tidos como im- 
possíveis de serem tratados em termos puramente sintaticocêntricos. May 
(1977: 26-29, 234-239) nomeara esse nível de LF” (leia-se: “LF-linha”). Esse 
mapeamento entre LF e LF” era uma elaboração significativa de algo já es- 
boçado em Chomsky (1975b), para quem LF (concebida nos termos des- 
critos acima) seria subsequentemente mapeada naquilo que ele chamava 
de a representação plena do significado, via “outras regras de interpretação 
semântica” que “interagem com outras estruturas cognitivas” (op. cit.: 105). 

A partir de May (1985), esse resíduo da visão original de Chomsky 
(1975b) foi eliminado. Isso não significa, de modo algum, que todos os 
fenômenos relativos ao significado conseguiram ser explicados por meios 
estritamente sintáticos (o que não se verifica hoje, muito menos há cerca de 
três décadas atrás). Desde então, muitas análises de fenômenos de significa- 
do baseadas em LF têm sido muito bem-sucedidas. Outras ainda esbarram 
em grandes obstáculos, a despeito de apontarem caminhos promissores. 
Enquanto houver algum fenômeno relativo ao significado mal-explicado, 
ainda existirá uma porta aberta para se retornar ao sintaticocentrismo mo- 
derado de May (1977), que admitia a existência de um nível semântico. 
Entretanto, poucos autores na GGT contemplam essa ideia. Metodologica- 
mente, aposta-se num sintaticocentrismo forte, no qual a semântica é toda 
feita pela própria sintaxe, e os aspectos do significado não representáveis 
em LF ficariam a cargo de um componente pragmático, externo à gramáti- 
ca, que lida com o uso das representações lógicas construídas pela sintaxe 
de acordo com circunstâncias da enunciação”. Essa visão fica mais explícita 
e mais concreta com o advento do Programa Minimalista, cerca de uma 
década após o clássico de May (1985). Pois é, embora o sintaticocentrismo 


41. Do outro lado da balança, os praticantes da SM majoritariamente apostam fortemente 
na ideia de que não existe LF (nem DS) e que um nível de interpretação puramente semân- 
tico (por vezes também chamado de Forma Lógica, mas que não se deve confundir com a 
LF dos chomskyanos) é extraído (via regras de'tradução') diretamente a partir de SS, ou do 
correlato mais próximo de SS na abordagem em questão (cf. Steedman 2000). 
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chomskyano seja avesso a um componente semântico autônomo, ele é bas- 
tante simpático à ideia de que partes relevantes do significado (inferências, 
implicaturas, acarretamentos, pressuposições, etc.) sejam tratadas em ter- 
mos puramente pragmáticos, extragramaticais. 

A vantagem de uma gramática baseada em LF comparativamente às al- 
ternativas não transformacionais residiria, em primeira instância, na sim- 
plicidade do aparato técnico, que dispensaria a tradução numa metalíngua, 
e mecanismos associados (como type-shifting) amplamente usados em aná- 
lises da SM, mas que são problemáticos mesmo dentro daquele arcabouço 
teórico porque, a rigor, implicam a violação da premissa da composicionali- 
dade fregeana tão cara aos montagueanos (cf. Pietroski 2005: 67-75,215-217). 

Além da questão da elegância do sistema, há vantagens empíricas numa 
teoria do significado baseada em LF. Os exemplos discutidos acima são mais 
simples (mais tratáveis dentro dos limites deste livro) e podem ser anali- 
sados em termos não transformacionais. Há, no entanto, fenômenos mais 
complexos, muito dificeis de serem analisados estritamente em termos de 
uma teoria semântica que pressuponha uma sintaxe não transformacional. 
Vimos, por exemplo, em $3.7, no dado (89), uma pequena amostra de uma 
grande família de fatos conhecidos como efeitos de reconstrução, e que se 
constituem em evidências empíricas fortes a favor de LF. Além disso, há 
outros fenômenos ainda mais intrincados, para os quais soluções trans- 
formacionais têm se mostrado cada vez mais necessárias, ainda que o de- 
bate esteja aberto e tentativas não transformacionais eventualmente sejam 
propostas. Não há espaço aqui para discuti-los, pois isso demandaria uma 
familiaridade com noções técnicas mais avançadas. Por ora, apenas indico 
ao leitor mais interessado em avançar seus estudos nessas questões que ele 
busque por descrições e análises acerca de Antecedent Contained Deletion 
(cf. May 1985: 11-13; Hornstein 1995: 53-58, 72-98; e obras lá referenciadas )º. 


42. Jacobson (1992) é rara análise não transformacional para esse fenômeno que tem boa 
cobertura empírica e um formalismo consistente e promissor, ainda que insuficiente para 
explicar os fatos completamente. 
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De volta ao padrão observado em sentenças envolvendo mais de um 
sintagma quantificado, faz-se pertinente acrescentar algumas informações. 
Primeiramente, note-se que, conforme a concepção de Minimalidade Re- 
lativizada (MR) aqui adotada (cf. $3.7), a coexistência de duas estruturas 
possíveis no nível de LF parece problemática, pois, em SS, uma mulher é 
c-comandado por todo homem, que se encontra mais próximo de uma 
posição periférica de adjunção a CP. Espera-se, portanto, que todo homem 
tenha preferência para ser movido primeiro e uma mulher depois, o que 
acarretaria a estrutura (45a) como a única possível, pois, no estágio da deri- 
vação em que SS se forma e começa a ser mapeada em LF, todo homem está 
numa posição “superior” a (mais c-comandante que) uma mulher, fazendo 
com que todo homem se mova primeiro e se torne o primeiro adjunto, 
emparelhado com o CP menor. Na sequência, uma mulher é movido, ad- 
jungindo-se ao CP então formado, e portanto ficando logo acima de todo 
homem. Se assim fosse, apenas a leitura (37a=44a) seria atestada, o que 
não confere com os fatos. Tal leitura é incompatível com uma situação em 
que os homens amam diferentes mulheres, que sabemos empiricamente ser 
um contexto no qual um enunciado da sentença (43) é verdadeiro. Aliás, 
esta é a interpretação mais saliente. 

Uma saída seria redefinir a MR não como uma propriedade do movi- 
mento em si, mas como um princípio representacional que regula o que 
pode ou não haver entre sintagmas movidos e seus vestígios em SS. Assim, 
a MR não se aplicaria entre SS e LF. Se necessário por razões empíricas, esse 
afrouxamento é tolerável, mas definitivamente ele enfraquece o poder ex- 
plicativo de um modelo que define LF como um nível sintático, construído 
a partir de SS através das mesmas operações transformacionais que cons- 
troem SS a partir de DS. É importante notar, porém, que o chamado alça- 
mento de quantificador difere dos demais movimentos ora vistos no sentido 
de que ele não é deflagrado por um núcleo atrator c-comandante que define 
a posição de chegada do movimento, a partir do qual se calculam as distân- 
cias. O alçamento de quantificador seria deflagrado pelas propriedades do 
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próprio sintagma quantificado, que demandam que ele saia do seu domínio 
sentencial imediato para estabelecer uma ligação entre operador e variável, 
via vestígio. Assim, a não observância do alçamento de quantificador à MR 
talvez não seja propriamente um problema. A propósito, até aqui está sendo 
assumida tacitamente a premissa de que movimentos de adjunção sempre 
'empilhariam” novos adjuntos em cima dos adjuntos anteriormente presen- 
tes, nunca intercalando adjuntos novos logo embaixo dos anteriores. Remeto 
o leitor a Richards (2001: cap 3) para evidências e argumentos em contrário, 
os quais, se corretos, sugerem que (45a) e (45b) sejam ambas LFs possíveis, 
ainda que todo homem deva se mover primeiro. Numa direção diferente, 
trabalhos como Fox (2000, cap 2, especialmente p. 62-66) discutem casos 
mais complexos em que construções com múltiplos quantificadores exibem 
efeitos de localidade sintática, tal que, de todas as combinações logicamente 
possíveis de movimentos de sintagmas quantificados, apenas algumas são 
atestadas. Há também análises alternativas como as de Hornstein (1995) e 
Kitahara (1996), sem movimento de adjunção de sintagmas quantificados 
com o propósito específico de estabelecer ligações entre operadores e variá- 
veis; sendo tais relações obtidas 'pegando carona” nos movimentos que tais 
NPs/DPs já fariam por razões independentes, havendo mais de uma escolha 
por quais cópias interpretar em LF (assumindo-se a teoria de movimento 
por cópia, cf. $3.7)º. 

Em suma, nas versões hegemônicas da GGT das últimas três a quatro 
décadas, não se nega totalmente que aquilo que se costuma entender por 
semântica exista sob alguma forma. Porém, a semântica é tomada como 
um epifenômeno, um “efeito colateral” da interação entre a sintaxe, os sig- 
nificados dos itens lexicais, e a própria competência pragmática. 


43. Remeto o leitor a Martin & Uriagereka (2008: 561-563) para um esboço de explicação 
para o fato de (44b) ser a leitura preferencial de (43), com base na visão Hornstein/Kitahara 
de quantificação. 
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Por fim, saliento uma simetria que frequentemente passa despercebida 
por muitos que comparam criticamente a GGT com abordagens baseadas 
na SM. Muitas abordagens não transformacionais investem fortemente na 
hipótese de que não há isomorfia entre sintaxe e semântica, no sentido de 
que as estruturas da metalíngua traduzida teriam suas características pró- 
prias, distintas daquelas da sintaxe. Segundo tal visão, o mapeamento entre 
sintaxe e semântica se daria a partir de uma “sintaxe de superfície que seria 
mais isomórfica à fonologia, pois, no limite, não teria nenhum dos elemen- 
tos fonologicamente nulos (vestígios, elipses, pronomes silenciosos, etc.) 
postulados pela GGT. Trata-se de uma concepção de gramática legítima e 
coerente que merece ser explorada. O mérito da comparação é em grande 
parte medido a partir da cobertura empírica de cada teoria. 

Entretanto, alguns adeptos da SM equivocadamente referem-se à discre- 
pância entre a sintaxe e a fonologia dos modelos da GGT (i.e. os movimen- 
tos, as elipses, os pronomes silenciosos, etc.) como abstrações absurdas, in- 
justificadas, arbitrárias, 'apelativas”. Essa crítica é infundada. As abstrações 
envolvidas na abordagem transformacional, as regras transformacionais 
em si e a discrepância entre a forma das estruturas sintáticas e fonológicas, 
são passíveis de questionamento como, aliás, tudo em ciência. Entretanto, 
elas não são, a priori, mais arbitrárias que as abstrações e postulações neces- 
sárias segundo a SM para se traduzir a sintaxe de superfície (isomórfica à 
fonologia) numa estrutura semântica apropriada. Nas teorias calcadas nos 
postulados da SM, há, por um lado, uma discrepância entre sintaxe e se- 
máântica, e, por outro, uma quasi-isomorfia entre sintaxe e fonologia (uma 
isomorfia não total porque a fonologia inclui, para além da sequência ter- 
minal, elementos adicionais como curvas melódicas, pausas, alongamentos 
de sílaba, etc.). Isso não é a priori melhor nem pior que a visão diametral- 
mente oposta da GGT segundo a qual LF é o nível gramatical que codifica 
em si a sintaxe e a semântica da sentença (havendo aí uma isomorfia quase 


total, pondo de lado os aspectos puramente pragmáticos do significado), 
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enquanto a sintaxe e a fonologia estariam distantes, sendo as discrepâncias 
decorrentes dos processos de mapeamento de uma para a outra (i.e. movi- 
mento, elipse, etc.), que não são a priori nem mais nem menos arbitrários 
do que os mecanismos de tradução na metalingua da SM, 

Permita-me dizer o óbvio de modo vulgar. O jogo é jogado, e não se ga- 
nha nem se perde na escalação dos atletas e na divulgação do esquema táti- 
co. Rotular como absurdas as abstrações da GGT em relação à discrepância 
entre sintaxe e fonologia é nada menos que desonesto. Todo teórico tem 
direito a suas “preferências estéticas. Quando postas à prova, elas deixam de 
ser apenas isso e passam a ser hipóteses testadas que foram corroboradas 
ou refutadas. Antes disso, algumas escolhas podem até ser mais elegantes 
que outras, por envolverem um aparato formal mais enxuto para explicar 
os mesmos fatos. A SM não goza dessa vantagem em relação à GGT, a me- 
nos que restrinjamos o escopo de seu estudo a fragmentos de gramática 
que são um subconjunto próprio de todo o legado da GGT no plano na 
adequação observacional, todos os fenômenos intrincados de cuja existên- 
cia não se sabia antes (embora também haja na SM descobertas importan- 
tes e análises consistentes). 


54.5. PADRÕES SONOROS“ 


Desde Chomsky (1951), Chomsky et al. (1956), Chomsky (1964: 30-33, 
65-110), Chomsky & Halle (1965), Chomsky (1967a), e, sobretudo, desde o 
clássico tratado de Chomsky & Halle (1968), The sound pattern of English 
(SPE)”, a visão geral de gramática de Chomsky tem influenciado massiva- 
mente até hoje a maioria das investigações em Fonologia de um modo ou 
de outro. Além dos continuadores da tradição chomskyana-halleana em 


44. Nesta seção, pressuponho do leitor relativa familiaridade com conceitos elementares de 
análise fonológica (cf. Souza & Santos 2003; Battisti 2014; Seara et al. 2015; os dois primei- 
ros títulos são mais sucintos e acessíveis). 


45. Nomeado em referência a The sound pattern of Russian, de Morris Halle (1959). 
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fonologia*, também os seus antagonistas” conduzem suas pesquisas tendo 
tal tradição como um de seus pontos de referência (ao qual se contrapoem). 
Já que Chomsky, pessoalmente, não se dedicou tanto a estudos fonológicos 
específicos ao longo de todas essas décadas até aqui, alguns, equivocada- 
mente, subestimam a sua importância para a área. Mas suas contribuições, 
na incepção da GGT, foram decisivas para quase tudo o que veio depois. 
No entanto, Chomsky não teria deixado o legado que deixou sem a 
sólida fundação antes estabelecida por Roman Jakobson, Gunnar Fant e 
Morris Halle. Desde a obra seminal de Nikolai Trubetzkoy (na primeira 
metade do século XX), já se analisava o continuum do sinal acústico conce- 
bendo-se a existência de segmentos (compreendidos como fones, fonemas, 
alofones), caracterizados em termos de suas propriedades. Por exemplo, já 
se concebia [m] como um “segmento consonantal vozeado com ponto de 
articulação bilabial e modo de articulação oclusivo-nasal”. Foi a partir de 
Jakobson et al. (1952, 1963) e Jakobson & Halle (1956) que essas dimensões 
articulatórias passaram a ser concebidas em termos de traços distintivos 
binários, num vocabulário universal para descrever o inventário total de 
segmentos fonológicos, do qual cada gramática particular apresenta um 
subconjunto próprio. Desde a incepção da ideia até hoje, há muitíssimas 


versões do que seria o sistema de traços da GU. A seguir, reproduzo a tabela 


46.0 Modelo SPE está para a Fonologia Gerativa assim como a Teoria Padrão está para a 
Sintaxe Gerativa. A partir do modelo SPE foram derivados vários modelos de análise fono- 
lógica, muitas vezes complementares, e.g. Fonologia Lexical (Kiparsky 1982, 1985; Mohanan 
1986), Fonologia Autossegmental (Clements 1985; Halle 1992), Fonologia Prosódica (Selkirk 
1984; Nespor & Vogel 1986; Inkelas & Zec 1990) e Fonologia Métrica (Halle & Vergnaud 
1987). Mesmo o modelo da Teoria de Otimalidade (Prince & Smolensky 2004 [1993], Kager 
1999; McCarthy 2008), que rompe com alguns princípios importantes do modelo SPE, é 
também uma continuação da Fonologia Gerativa em muitos de seus aspectos axiais. 

47. E.g. Ohala (1990, 1995, 1997) e Browman & Goldstein (1986, 1989, 1992). Albano (2001) 
apresenta essa visão geral de que a fonologia se reduziria a um mínimo de especificações 
lexicais, sendo as alofonias decorrentes de processos essencialmente fonéticos, e aplica tal 
modelo a dados do português brasileiro. 
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clássica de Chomsky & Halle (1968: 176-177) que resume as bases sobre as 
quais a fonologia segmental se desenvolveu*. 

Cada traço representa um dos critérios de classificação dos segmentos, 
uma propriedade, concebida em termos binários (tal como direita e es- 
querda, morto e vivo, vertebrado e invertebrado, etc.). Tal binarismo não 
é uma necessidade lógica. É imaginável que cada um dos traços possa as- 
sumir mais de dois valores possíveis. Pode-se também tomar alguns traços 
como binários e outros não. Em última instância, trata-se de uma questão 
empírica. Em primeira instância, um modelo de traços binários é formal- 
mente muito enxuto, possibilitando descrever os muitos segmentos articu- 
latoriamente possíveis através da combinatória de um pequeno número de 
traços, todos eles concebidos do modo mais simples possível. 

Há dois aspectos importantes e “distintivos” dessa abordagem, um mais 
conceitual e outro mais técnico. A Fonologia Gerativa elabora a proposição 
introduzida no Estruturalismo de que há pelo menos dois níveis de repre- 
sentação no que concerne aos sons linguísticos: o fonológico e o fonéti- 
co”. No plano fonológico, sons são unidades abstratas compostas de partes 
independentes, que só existem enquanto entidades psicológicas, indicadas 
entre barras inclinadas. No plano fonético, indicados entre colchetes, sons 
são eventos físicos (acústico-articulatórios), indivisíveis em partes discretas 
que possam existir umas sem as outras”. 

Além disso, ao se conceberem essas entidades psicológicas em termos de 
“pacotes” de traços distintivos binários, torna-se possível definir as classes 


48. Cagliari (1997a: 71-74) traz uma explicação clara, suficientemente detalhada e acessível 
sobre cada um dos traços propostos em Chomsky & Halle (1968), comparando tal sistema 
ao de Jakobson et al. (1963). 

49, A rigor, no modelo SPE (e descendentes), há uma distinção importante entre o nível 
fonético (que já incorpora um grau de abstração) e o nível físico (acústico-articulatório). 
Fundo aqui os dois para fins didáticos. 

50. E.g. Um segmento com modo de articulação fricativo não tem como não ter ponto de 
articulação, pois a propriedade de ser fricativo implica a aproximação estreita de dois arti- 
culadores em algum ponto do trato vocal. 
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naturais (os sons nasais, os fricativos, os oclusivos, etc.) de modo mais pre- 
ciso, pelo simples compartilhamento ou não de um ou mais traços. Assim, 
vai-se além do nível da adequação observacional (i.e. listar os segmentos 
que se comportam de modo semelhante), viabilizando um tratamento nos 
níveis descritivo e explicativo para o fenômeno de que certos processos fo- 
nológicos (vozeamento, nasalização, apagamento, etc.) tipicamente não se 
aplicam a segmentos específicos (e.g. /s/), mas a coleções de segmentos que 
compartilham ao menos um traço (e.g. /s/, /z/, [f/, /vl, |x/, Iyl, [h/, /h/) e 
que excluem todos os demais segmentos sem esse(s) traço(s)*. Em termos 
de adequação explicativa, assumir um sistema de traços universal e inato 
nos propicia formular hipóteses testáveis acerca do que seriam classes na- 
turais possíveis ou impossíveis de existir nas diversas línguas e quais tipos 
de 'erro' crianças cometeriam ou não durante a aquisição. 

A propósito dos níveis de adequação em fonologia, replico aqui a ar- 
gumentação de Chomsky (1964: 30-31), adaptando os dados para o portu- 
guês. Temos o item balé [ba.le] no léxico. Não temos bralé [bra.le], mas 
poderíamos ter. Esse arranjo de segmentos é uma combinação possível, que 
podemos usar para atribuir um nome exclusivo para algo recém-inventa- 
do. Enfim, [bra.le] é um IL possível, ou melhor, um significante possível. O 
mesmo não pode ser dito sobre * [bna.le]. Ao escutarmos tal dado, julgamo- 
-lo estrangeiro; ou o percebemos como se fosse o trissílabo [bi.na.le), cuja 
estrutura fonológica é distinta e legitimada pelo sistema. Por que há esse 
contraste entre os dois ILs hipotéticos, se ambos /r/ e /n/ são segmentos da 
língua? Afinal, o signo linguístico é ou não é arbitrário (cf. Saussure 1916: 
97-113)? Sim, mas isso é limitado pelo inventário de segmentos da gramá- 
tica em questão, bem como por suas regras fonotáticas, que preveem quais 
tipos de segmento podem ser adjacentes no início de uma mesma sílaba. 
Se só listarmos [ba.le] e [bra.le] como significantes possíveis e *[bna.le) 


51. Numa terminologia mais rigorosa, há diferença entre traço (e.g. [nasal)) e traço valora- 
do (e.g. |-nasal] e [+nasal]). Quando falo em ter um mesmo traço, refiro-me na verdade a 
ter o mesmo valor para tal traço. 
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como impossível, não passamos do nível observacional. Atingimos o nível 
descritivo quando caracterizamos com precisão regras que determinam os 
encontros consonantais possíveis e impossíveis, com base na constituição 
de traços dos segmentos e suas posições relativas. Atingimos o nível expli- 
cativo quando nossas formulações para as regras preveem corretamente 
padrões observáveis nos estágios da aquisição de linguagem (i.e. 'sotaques 
infantis” possíveis e impossíveis), bem como a universalidade da existência 
ou inexistência de certos tipos de sílaba. 

Sigamos o raciocínio a partir dos nomes próprios Oscar [os.kah] e Os- 
mar [oz.'mah]. Se quisermos, podemos criar outros similares, como Ispar 
[is'pah], Esbar [ezbah], etc. Contudo, *[oz.kah] e *[os'mah] são signi- 
ficantes impossíveis, como quer que os grafemos, ainda que sejam muito 
parecidos com os nomes próprios reais [os.kah] e [oz.'mah). O problema 
com as formas agramaticais *[0z.kah] e *[os.'mah] reside no fato de as ins- 
tâncias das fricativas [z] e [s] em final de sílaba (respectivamente, +vozeada 
e —vozeada) estarem imediatamente seguidas por segmentos com valores 
opostos aos de seus traços de vozeamento (i.e. [k] é -vozeado e [m] é +vo- 
zeado). Conforme a fonotaxe da língua, fricativas em final de sílaba devem 
“concordar em vozeamento" com o segmento que inicia a sílaba seguinte, 
o que, no modelo SPE, é formalizável nos termos da regra de vozeamento 
em (46)2. 

(46) 


15 ! 


atento estado? Lota)! = Cito) 


52. Cf. Chomsky (1965: 82). Uso aqui o traço +fricativo como um atalho notacional sim- 
plificador. A rigor, pelo sistema SPE (e subsequentes elaborações), a fricatividade é fruto 
de uma combinação de traços independentes. Embora seja possível formalizar uma regra 
que, literalmente, faça uma fricativa 'concordar em vozeamento” com o segmento seguinte, 
a opção por uma regra unidirecional de vozeamento de fricativas desvozeadas é empiri- 
camente motivada pela inexistência de dados com fricativas vozeadas em final de palavra 
(e.g. temos [pas] e [gas), mas não * [paz] e * [gaz]), indicando que /s/ é o fonema subjacente 
e [2] e [s] seus alofones marcado e não marcado, respectivamente. O alofone marcado é o 
que resulta da aplicação da regra. 
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Esse tipo de regra (típico do modelo SPE e subsequentes elaborações) 
tem as mesmas características formais das transformações locais de in- 
serção lexical na Teoria Padrão (cf. $3.6). Nesse sentido, recomendo a lei- 
tura da seção Some formal similarities between syntax and phonology em 
Chomsky (1965: 79-83) para se ter uma ideia clara de como os níveis de 
representação são articulados. O efeito de (46) é que, no mapeamento da 
representação fonológica para a fonética, uma sequência de segmentos 
contendo uma consoante fricativa -vozeada tem tal segmento substituído 
por outro idêntico em todos os seus traços, exceto pelo fato de ser +vozea- 
do; e isso só ocorre se o segmento alvo da substituição estiver em fim de 
sílaba e o segmento imediatamente seguinte for +vozeado. Enfim, (46) é 
uma regra de reescritura transformacional, cuja sensibilidade a contexto 
se restringe às adjacências. 

Na formulação de (46), é fundamental especificar que o segmento a ser 
afetado esteja em fim de sílaba e o segmento que lhe “transmite” o traço 
+vozeado inicie a sílaba seguinte. Do contrário, não teríamos o par míni- 
mo assar [a.'sah] e azar [a.'zah], por exemplo; mas apenas o segundo dado. 
Porém, se acrescentamos o prefixo des [des] a atar [a.tah], temos catego- 
ricamente [de.za.'tah] e não *[de.sa.tah). Aí, temos a conversão de /s/ em 
[z] diante do segmento vozeado /a/, estando os segmentos adjacentes numa 
mesma sílaba”, 

A solução para esse aparente dilema é simples. Além de (46) e de ou- 
tras tantas regras, a gramática teria mecanismos que arranjam e rearranjam 
segmentos em sílabas, tal que o início de sílaba é uma posição preferencial 
para consoantes, em comparação com o fim de sílaba. Assim, o segmento 
|s/ do prefixo des (que ocupa o fim de sílaba em desfazer [des.fa.'zeh] e des- 
ligar [dez.li'gah]) é (reJalocado no início da sílaba seguinte em [de.za.'tah]. 


53.0 mesmo fenômeno se observa em fronteira de palavra. Temos bo.la[s], bo.la[s).pre. 
tas, e bo.la.[2Ja.ma.re.las. 
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Isso, por si só, não explica tudo. O outro ingrediente da solução está na 
postulação de que as regras fonológicas não se aplicam simultaneamente a 
uma forma subjacente, mas sim sequencialmente, uma atuando sobre o re- 
sultado gerado pela outra. Logo, uma gramática fonológica, além de espe- 
cificar as regras de transformação local, especifica também uma hierarquia 
entre elas, uma ordem de aplicação. Neste caso, a regra de (re)estruturação 
silábica necessariamente se segue à regra de vozeamento de fricativas em 
fim de sílaba em (46). Caso contrário, teriamos *[de.sa.'tah] em vez de 
[de.za.'tah], porque o posicionamento de /s/ em início de sílaba o torna- 
ria imune a uma eventual aplicação subsequente da regra (46). 

Nessa perspectiva, desvendar o funcionamento de uma gramática 
fonológica envolve descobrir suas regras e o ordenamento entre elas. A 
princípio, isso implica necessariamente um modelo derivacional para o 
componente fonológico da gramática. Esta tem sido a posição dominante 
entre os fonólogos contemporâneos mais alinhados à tradição chomskya- 
na-halleana (cf. William Idsardi, Andrew Nevins, Eric Raimy, Bert Vaux, 
inter alia). Entretanto, na vertente da Fonologia Gerativa hoje hegemônica, a 
Teoria da Otimalidade (Prince & Smolensky 2004 [1993]; McCarthy & Prin- 
ce 1993; et seq.), muitos dos fenômenos similares ao que esbocei acima 
são tratados com recursos puramente representacionais. Isso não signi- 
fica, porém, que não haja ordem linear entre requerimentos gramaticais, 
no sentido estritamente matemático (i.e. as propriedades de assimetria, 
irreflexividade, transitividade e conectividade)*. Muitos fonólogos, de 
orientação mais representacionalista ou derivacionalista (e.g. McCarthy 
2000; Mohanan 2000; Calabrese 2005) reconhecem que, em grande parte, 
há uma equivalência formal entre as abordagens. Ou seja, implementado 
de uma forma ou de outra, o ordenamento de regras proposto em SPE 
prevalece até hoje como um ingrediente essencial da teoria da análise fo- 


54. Cf. Partee et al. (1993: 27-53). 
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nológica”, Nesse contexto, Vaux (2008) e Odden (2008, 2011), inter alia, 
salientam que há fenômenos muito desafiadores para as implementações 
representacionais, pois pressupõem estágios derivacionais intermediários 
sem correlato representacional, exceto se forem postulados diversos me- 
canismos ad hoc que preveem o resultado observado, comprometendo 
sobremaneira o poder explicativo do modelo, já que não há unificação 
possível dos padrões em termos representacionais. 

Voltemos agora à concepção do segmento como um “pacote” de traços. 
No modelo SPE, tais 'pacotes' (tecnicamente chamados de matrizes) eram 
formalizados como coleções não estruturadas de traços (i.e. não have- 
ria qualquer ordem de importância entre os traços, nem 'submatrizes' de 
traços compondo a matriz total). Por exemplo, conforme a Figura 1 aci- 
ma, /z/ seria [-vocálico, +consonantal, -alto, -recuado, -baixo, +anterior, 
+coronal, +vozeado, +contínuo, -nasal, +estridente)*. Com o advento da 
Fonologia Autossegmental (cf. Clements 1985, et seq.), tornou-se pra- 
ticamente consensual conceber a matriz de traços em termos de uma 
Geometria de Traços. Ou seja, os traços da matriz estariam organizados 
em submatrizes, cada uma correspondendo a uma certa dimensão arti- 
culatória do aparelho fonador (i.e. traços relativos à laringe, à cavidade 
oral, à raiz da lingua, etc.)”; o que faria previsões mais acuradas quanto a 
quais traços seriam manipulados conjuntamente ou separadamente pelas 
regras fonológicas, sendo os demais traços “invisíveis, portanto não in- 
terferindo no processo em questão. Esse modelo de geometria de traços 
mostrou-se capaz de dar conta de fenômenos antes desafiadores de inte- 


55. Remeto o leitor à coletânea de textos editada por Vaux & Nevins (2008) sobre o tema. 


56. Para uma introdução sucinta e bastante esclarecedora sobre traços distintivos e classes 
naturais, com base num sistema de traços mais contemporâneo e enxuto, recomendo for- 
temente Souza & Santos (2003: 42-47). 

57. Para uma visão panorâmica, mas relativamente detalhada dessa família de análises, cf. 
Kenstowicz (1994, cap 9). Cagliari (1997b) oferece uma introdução simplificada com apli- 
cações a dados do português brasileiro. 
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ração entre segmentos não adjacentes, sem a necessidade da postulação 
de transformações não locais”. 

Isso se traduz num modelo mais restritivo quanto às possibilidades de in- 
teração entre segmentos, portanto um modelo mais testável, pois prevê mais 
impossibilidades, as quais, se atestadas, mostram a ineficácia do sistema; e, 
se não atestadas, corroboram a proposta. No plano da adequação explicati- 
va, a geometria de traços permite a formulação de uma versão mais enxuta 
da parte fonológica da GU, o que se traduz em menos opções disponíveis 
para a criança-aprendiz, facilitando e acelerando o processo de aquisição. 

Em (47), ilustro a abordagem da Fonologia Autossegmental com o dia- 
grama correspondente à implementação concreta de Geometria de Traços 
proposta por Halle (1992). 


(47) [Econsonantal, +soante) 


[Hlateral] 
[Econtínuo) Laringe Supralaringe 
Hestridente] gy Raiz da Língua Lugar QUI Palato Mole 
[tpregas tensas) [£avançada] [+retraída] Labial Coronal Dorsal [+nasal] 
[pregas frouxas| [tarredondado) 
Eglate consteita] [&anterior] [+distribuído] |+aLTof+baixo][+posterior] 
[tglote espalhada] 


O que passa despercebido para muitos é que o insight básico da geo- 
metria de traços tem origem no sistema de Chomsky (1965: 79-83) de 


58. O exemplo mais comum disso são os padrões de harmonia vocálica, por vezes bem-in- 
trincados, encontrados em várias línguas (cf. Souza & Santos (2003: 49-50) para uma intro- 
dução acessível a fatos do finlandês). Em português, temos alguns casos bem simples, como 
a alternância entre nfelglolcio e nfelglolcio, ou gr[o]s[e]lha e gr[o]sle]lha, nos quais o 
segundo elemento do par está “harmonizado” por uma regra presente em alguns dialetos, 
que transforma vogais médio-altas em médio-baixas, se elas precederem uma vogal médio- 
-alta (cf. Cagliari 1997b: 93-94). Nesses casos, a precedência imediata é relativa. A consoante 
que intervém entre as vogais envolvidas é “invisível” para o processo. Essa (in )visibilidade 
relativa é algo capturado de modo relativamente trivial assumindo a álgebra da Geometria 
de Traços, capaz de representar a localidade entre as vogais relevantes. 
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reescritura de nódulos sintáticos pré-terminais, e de inserção lexical, em 
que já se traçava explicitamente um paralelo entre sintaxe e fonologia (o 
que remete a Chomsky 1961a, 1962a, 1962b), inclusive afirmando que 
aqueles mecanismos sintáticos eram inspirados no trabalho de fôlego de 
Chomsky & Halle, então em andamento, e que viria a ser publicado em 
1968”. Abaixo, reproduzo dois esquemas de Chomsky (op. cit.: 82-83) que 
são relevantes para ilustrar o ponto em questão. Aproveito para frisar 
que era através desse formalismo que os graus de gramaticalidade eram 
analisados na Teoria Padrão. O grau de gramaticalidade da inserção dos 
ILs efetivamente inseridos nos nódulos subterminais abaixo de N (ou V, 
A, etc.) depende da compatibilidade maior ou menor entre os traços, sen- 
do que nódulos mais altos têm mais peso que nódulos mais baixos. 


(482) N 5 [+N, tcomum] (49) N 

(48b) [+comum] 5 [tcontável] I 

(48c) [+contável] > [tanimado] comum 

(48d) [-comum] > [£animado] + É 

(48e) [+animado] > [+humano] contável animado 


(48f) [-contável] > [tabstrato] + = - NE 
animado abstrato Egito humano 
humano livro virtude sujeira João Totó 


+ e 
menino cachorro 


Há muitos outros pontos sobre fonologia que seriam pertinentes aqui 
(e.g. interface entre sintaxe e prosódia, processos fonológicos internos ou 
externos à palavra, padrões acentuais, etc.). Contudo, dados os limites de es- 
paço e o recorte escolhido, seleciono apenas mais um ponto que julgo mui- 
tíssimo importante, porque ele se relaciona a um grande mal-entendido que 


59. Como já dito, a seção de Chomsky (1965) se chama Some formal similarities between 
syntax and phonology. 
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persiste na literatura técnica brasileira em fonologia, sobretudo nos mate- 
riais dirigidos a estudantes, nos quais ainda se adota uma concepção de lín- 
gua demasiadamente saussureana/mattosiana quando se apresentam con- 
ceitos oriundos da Fonologia Gerativa, gerando contradições e paradoxos. 

Em $4,4.1, citei a crítica de Chomsky (1955a: 93-94) ao semanticocen- 
trismo. Ele apontava que é injustificada a premissa de que se deve recor- 
rer ao significado para fazer análise da forma linguística; e que antes de se 
perguntar ceticamente como se poderia fazer análise gramatical sem apelo 
ao significado, devemos nos perguntar que alternativas baseadas no signi- 
ficado existem, e o quanto elas dão conta de explicar os padrões da forma. 
Tanto àquela época quanto hoje, costuma-se “dar de barato” que o significa- 
do é a razão primeira e última para o estudo da forma. Quanto às relações 
de alofonia e contraste entre segmentos, é fácil demonstrar que isso é falso, 
como feito em detalhe por Chomsky (1955a: 86-94; 1957: cap 9), em quem 
me baseio para elaborar a explicação simplificada que se segue. 

Parto de definições canônicas de alguns conceitos-chave, com base em 
Cristófaro-Silva (2011): uma obra de referência no ensino de fonologia no 


Brasil. A autora (op. cit.: 92-93) define fonema como uma “unidade sonora 


[...] que se distingue funcionalmente de outras unidades sonoras da língua; 
[dJois sons podem ser classificados como fonemas quando estão em con- 
traste e oposição; [o]u seja, são sons diferentes em um mesmo contexto, em 
palavras com significados diferentes”, Na mesma obra (p. 52-53), alofone é 
definido como um “som que apresenta equivalência funcional com um ou 
mais sons, constituindo o conjunto de realizações de um mesmo fonema; 
[gluando alofones são distribuídos no mesmo contexto de uma palavra não 
propiciam mudança de significado”, Adiante (p. 109), par mínimo é defini- 
do como “duas palavras com significados diferentes cuja cadeia sonora seja 
idêntica, exceto por um segmento na mesma posição estrutural; [ujm par 
minimo identifica dois fonemas”. Por fim (p. 170), distribuição complemen- 
tar seria o “método de identificação de alofones” em que “[dJois sons estão 
em distribuição complementar quando ocorrem em ambientes exclusivos”, 
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Sob essa ótica, [blala e [vlala formam um par mínimo que identifica 
os fonemas /b/ e /v/. O fato de essas palavras terem significados distintos 
realmente importa? Segundo as definições canônicas, sim. O que dizer, en- 
tão, da variação livre entre asso[blio e asso[vlio, que significam a mesma 
coisa? Se você tem ambas as formas no léxico do seu idioleto, o problema 
se coloca de modo flagrante, pois as definições assumidas pressupõem que 
elas deveriam ter significados distintos para formarem um par mínimo, ca- 
racterizando o “contraste/oposição” que define /b/ e /v/ como fonemas dis- 
tintos. Ainda que você só tenha uma dessas formas no seu idioleto, é trivial 
incorporar a outra forma ao léxico como um nome alternativo para a mes- 
ma coisa. Abundam casos assim em nossa competência lexical (e.g. semá- 
foro/farol/sinal/sinaleiro, tangerina/mexerica/bergamota/mimosa, etc.). Se 
um mesmo significado pode ser expresso por significantes tão diferentes, 
o que o impediria de ser expresso por dois significantes quase idênticos? 
Se subtrairmos das definições as considerações sobre o significado, temos 
asso[blio e asso[vlio como um par mínimo. 

Identificamos contraste entre /b/ e /v/ independentemente da semântica. 
Por exemplo, diante de significantes novos como [ga.vi.los] e [ga.bi.los], 
identificamos logo dois arranjos gramaticais de segmentos; portanto, duas 
palavras possíveis. Não importa se elas têm significados distintos ou se são 
mais um caso de dois nomes alternativos para a mesma coisa. Afinal, a nos- 
sa intuição gramatical não vacilou em detectar dois significantes distintos 
(com fonemas distintos) antes mesmo de sabermos sobre possíveis signi- 
ficados a eles atrelados. Tratar casos de variação livre em termos de alofo- 
nia contradiz enormemente o critério de base de que alofones devem estar 
em distribuição complementar, o que não se tem em asso[blio e asso[vlio. 
Uma aparente saída para o impasse é distinguir entre contraste e oposição, 
sendo o último dependente de diferença de significado (cf. Cristófaro-Silva 
2011:82-83, 165-166). A noção de contraste basta. Pares mínimos são melhor 
definidos em termos de significantes contrastantes, em vez de oposição en- 
tre palavras (i.e. significante e significado). 
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Classificar a variação livre como alofonia pressupõe ainda diferenciar 
entre alofones livres e posicionais, ambos implicando contraste, apenas o 
segundo implicando distribuição complementar e oposição (cf. Cris- 
tófaro-Silva 2011: 52-53). Além de todos esses conceitos adicionais, há o 
de arquifonema, oriundo do Círculo Linguístico de Praga, e adotado por 
Mattoso Camara (1970: 50-52; 2008 [1953]: 27-42, 72-84) em sua clássica 
análise do português. É fato que um IL como mar tem pronúncia variável, 
conforme o dialeto (i.e. [mar], [mar], [may], [max], [mah]), podendo ha- 
ver variação até na fala de um mesmo falante. Mattosianos veem nessas for- 
mas os alofones livres [r,r, 4 x, h], todos oriundos do arquifonema /R/, cuja 
realização fonética pode ser qualquer um de seus alofones, de modo inde- 
pendente da estrutura, apenas “dependente do dialeto”. O caso de asso[blio e 
asso[vlio é mais problemático, pois tem-se aí variação livre na mesma posi- 
ção silábica em que se tem contraste (cf. [blala e [vlala), tornando inútil se 
propor um arquifonema. Isso nada mais é que uma falha em se distinguir 
entre Língua-I e Língua-E, equivocadamente tentando explicar o fato em 
termos da Língua-E, sem reconhecer aí diferentes léxicos, inventários de 
segmentos, e regras de alofonia. No limite, cada idioleto pode ter seu pró- 
prio fonema para o que, no plano na Língua-E, percebemos como “o som 
de R em fim de sílaba”, bem como eventuais regras alofônicas próprias. 
Nada impede que o falante domine múltiplos desses idioletos, sendo um 
deles o nativo, e os demais tendo caráter de “língua estrangeira” aprendida 
no convívio social. 

Termino com uma analogia visando esclarecer de vez a superioridade 
da visão de que os significados atrelados aos significantes são irrelevantes 


60. Curiosamente, se meus vizinhos estrangeiros falam mar pronunciando o último fone 
como a uvular [), isso não é visto como um alofone de /R/. Num país de dimensões conti- 
nentais como o Brasil, com tanta diversidade cultural, por que não reconhecer a existência 
de um dialeto da família de imigrantes do andar de cima, que são tão fluentes e se comuni- 
cam tão bem? Nativos ditos 'com língua presa' pronunciam céu como [8]éu. Outros dizem 
a[GJalG]a para arara. Por que não reconhecer esses dialetos e seus alofones para /S/ e /Rf? 
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para se compreender os contrastes e as alofonias. Digamos que eu vá me 
cadastrar numa plataforma da internet. Para isso, devo escolher um iden- 
tificador de usuário (um ID): uma sequência de símbolos que o sistema 
identifique como associada apenas a mim. Eu preencho o campo vazio com 
maxguimaraes, e o sistema me retorna uma mensagem dizendo que aquele 
ID não está disponível. Isso não significa que aquela sequência não é um ID 
possível. Significa apenas que, antes de mim, outra pessoa (provavelmente 
meu xará) chegou primeiro e já se apossou daquele ID. Eu tento novamen- 
te: max.guimaraes e max-guimaraes. Para ambos, o sistema retorna uma 
mensagem de erro: “ID não admissível”. Agora o caso é outro. Ninguém 
se apossou desses IDs. Eles violam o código de sequenciamentos possíveis 
de símbolos (digamos que o sistema só aceite IDs com letras e/ou núme- 
ros, e com até 12 caracteres). Tento mguimaraes01 e o sistema processa 
meu cadastro. Aproveito e faço um segundo cadastro com mguimaraes02, 
que também é processado. Dos cinco IDs que tentei, dois foram rejeita- 
dos estritamente por suas formas. Três eram formas lícitas, uma das quais 
já significava “pertencente ao meu xará”. As duas últimas têm um mesmo 
significado: i.e. “pertencente a mim”. Por critérios puramente formais, elas 
formam um par mínimo. Em suma, cada forma tem um significado, mas 
este não precisa ser exclusivo daquela forma. Nada impede que um mesmo 
significado esteja também atrelado a outra forma. Enfim, os requerimentos 
que regem a combinatória de segmentos fônicos não ligam para os signifi- 
cados dos significantes. 

Como claramente demonstrado por Nevins (2016) — em sua ilumina- 
dora defesa do uso de metodologias experimentais baseadas em logatomas 


(palavras inventadas) — os juízos de aceitabilidade acerca de sequências de 
segmentos para formar palavras novas é o exato correlato fonológico do 
contraste que observamos na sintaxe quanto à aceitabilidade de Ideias ver- 


des incolores dormem furiosamente e a inaceitabilidade de * Furiosamente 
verdes dormem incolores ideias (cf. 82.1). Em ambos os casos, aspectos 


semânticos são irrelevantes. 
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Minhas últimas palavras desta seção e deste capítulo vão na direção de 
esclarecer o porquê de haver aqui um aparente desequilíbrio bem acentua- 
do quanto ao maior espaço dedicado a questões sobre LF e o menor espaço 
dedicado a questões sobre PF. Isso não reflete, de modo algum, diferentes 
graus de importância atribuídos a essas questões nas últimas seis décadas e 
meia por parte dos chomskyanos em geral, ou do próprio Chomsky*!, Do 
ponto de vista da concepção geral de teoria da gramática, tal como estabe- 
lecida em Chomsky (1955a), os estudos fonológicos têm tido um lugar de 
destaque, constituindo-se numa linha de investigação bastante ativa e fru- 
tífera. Aliás, a depender de como encaremos a questão, a fonologia tem sido 
até mais estudada que a semântica na GGT, se entendermos que, nesse qua- 
dro teórico, a semântica é um “efeito colateral da sintaxe” Esse aparente de- 
sequilíbro se explica, no contexto deste livro, pelos motivos que se seguem. 

Defini como escopo deste trabalho a obra individual de Chomsky como 
principal, e as obras dos demais chomskyanos como o contexto de pro- 
dução e recepção do empreendimento científico da GGT. Nesse sentido, 
é preciso ressaltar que, aproximadamente quando da publicação de SPE, 
Chomsky fez a opção pessoal de se afastar dos estudos fonológicos mais 
específicos, em razão de ter que escolher quais tópicos da teoria gramatical 
ele deveria perseguir ou deixar de lado, diante da necessidade que ele sentia 
de dedicar uma parte substancial do seu tempo ao ativismo político (cf. 
Chomsky 1982b: 57). Em suma, ele 'passou a bola” para colegas e sucessores 
que têm “tocado o barco” desde então. 


61. Para mim, pessoalmente, o desequilíbrio oposto seria bem mais fácil, posto que, para 
além da sintaxe stricto sensu, eu já conduzi pesquisas e publiquei trabalhos em fonologia, 
mas não em “semântica”. 
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$5. Do Conhecimento 
Gramatical Não Adquirido 


85.1. PRESENTE DA MÃE-NATUREZA OU FRUTO DA 
EXPERIÊNCIA? 


Até aqui, abordei sem aprofundamento a tese chomskyana de que o cé- 
rebro humano é geneticamente dotado de algo que faz emergirem estrutu- 
ras mentais correspondentes a uma Gramática Universal (GU), que seria o 
conhecimento internalizado inato — prévio a qualquer exposição a atos de 
fala — de princípios estruturantes especificamente gramaticais, não se tra- 
tando de estratégias de aprendizagem da inteligência geral. 

Em suma, nascemos sabendo uma dose substancial de gramática, um 
conhecimento específico, não compartilhado com outras habilidades cog- 
nitivas. Isso não implica que a gramática não possa ter propriedades co- 
muns a outros domínios do pensamento; nem que não possa haver algo 
como as estratégias de aprendizagem da inteligência geral. Significa, po- 
rém, que, quando uma criança internaliza uma gramática, ela não faz isso 
apenas com base em estratégias de aprendizagem da inteligência geral apli- 
cadas às observações de atos de fala concretos oriundos da experiência'. 


1. Por exemplo, crianças em Curitiba ouvem Eu comi romã; crianças em Okinawa ouvem 
Watashi-ga zakuro-o tabemashita; crianças em Frankfurt ouvem Ich habe Granatapfel 
gegessen, etc. Dessas experiências com sentenças que expressam eventos conclusos no 
passado, crianças de cada população extrairiam, respectivamente, os padrões canônicos 
(i) sujeito — verbo flexionado — objeto, (ii) sujeito — objeto — verbo flexionado; e (iii) su- 
jeito — auxiliar flexionado — objeto — particípio verbal. 


Na tarefa de internalizar uma gramática específica, a criança faria uso de 
um conhecimento de natureza estritamente gramatical, que, por ser inato 
e compartilhado com todos os membros da espécie, seria universal”. Assim, 
qualquer gramática específica que venha a ser internalizada embute em si 
esses mecanismos gramaticais, que seriam a base sobre a qual se constrói o 
resto da gramática mental, e o ponto de partida para se começar a decifrar 
o barulho da fala, reconhecendo ali estrutura gramatical. 

Defender a existência de universais linguísticos não implica negar que 
há diferenças entre as várias línguas. Jamais foi proposto que tudo nas gra- 
máticas seria inato e universal”. Idiossincrasias de línguas particulares hão 
de ser depreendidas em grande parte com base em estratégias de aprendiza- 
gem da inteligência geral aplicadas às observações de atos de fala concretos 
oriundos da experiência. Aliás, a própria GU inata provavelmente serviria 
de guia para identificar e classificar elementos gramaticais idiossincráticos 
de línguas particulares, mas isso, por si só, não nega que existam estratégias 
de aprendizagem da inteligência geral. 

As afirmações acima, tal como postas, são ainda genéricas e vagas, ape- 
nas apontando possibilidades; e demandam argumentos conceituais em 
seu favor, bem como evidências empíricas. A seguir, aprofundarei o tema 
na medida do possível, dados os limites de espaço e escopo. A seleção de 
tópicos que fiz prioriza os aspectos da tese do inatismo gramatical que se- 
riam mais apropriados para uma introdução ao tema, bem como aqueles 
que oponentes da GGT mais criticam de forma equivocada, com mal- 
-entendidos e distorções. 

Certa ou errada, a tese do inatismo gramatical, embora seja uma pro- 
posta original de Noam Chomsky (com posterior colaboração substancial 


2. Cf. Chomsky (1984: 49) sobre a hipótese especulativa de haver microvariações da GU 
entre humanos. 

3, Em diálogo com Inhelder (1980), Chomsky (p. 138) deixava claro que admite que parte 
da gramática é adquirida via experiência e inteligência geral e outra parte provém da GU; 
contrapondo-se a Piaget (19804, 1980b, 1980c) para quem não existiria GU alguma. 
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do filósofo Jerry Fodor, entre outros), tem antecedentes históricos que re- 
montam a discussões filosóficas muito antigas. Há séculos, diversos pen- 
sadores já travaram debates acirrados sobre as ideias serem fruto da expe- 
riência do indivíduo com o mundo exterior ou serem inerentes à própria 
natureza do organismo humano (que os pensadores mais antigos viam 
como o espírito”). 

Cerca de quatro séculos antes do calendário cristão, Platão defendera, 
em sua obra Menon, que, mesmo sem se dar conta e sem treinamento espe- 
cífico ou observação e reflexão prévias, qualquer um nasce sabendo certos 
conceitos fundamentais da geometria euclideana. Para Platão — cuja obra 
é bem anterior às teorias de Charles Darwin e de Gregor Mendel sobre 
evolução e hereditariedade — a origem do conhecimento inato remonta- 
ria a encarnações passadas dos espíritos (o que só transfere o problema 
para outro nível, já que seria preciso explicar como, num passado remoto, 
os espíritos teriam adquirido tal conhecimento). Essa obra emblemática 
influenciou muitos pensadores ao longo da história, incluindo o próprio 
Chomsky (1986a: xxv-xxix), que paga tributo para o insight do antigo filóso- 
fo ao denominar de Problema de Platão o grande desafio enfrentado pelos 
linguistas ao tentar ultrapassar o nível da adequação descritiva e atingir o 
nível da adequação explicativa (cf. $2.6). A resposta chomskyana para o 
problema é neoplatônica e neocartesiana, no sentido de propor que uma 
parte substancial do conhecimento relevante é geneticamente determina- 
da; portanto, não sendo aprendida pelas crianças, e sendo universal, pre- 
sente em todas as línguas. 

Outra das fortes influências do passado na obra chomskyana foi o fi- 
lósofo René Descartes, do século XVII. Entre muitas de suas reflexões so- 
bre “ideias intrínsecas ao espírito) destaco uma que Chomsky (1980d: 112) 
mencionou em seu debate com Piaget. 


Descartes faz o seguinte tipo de observação. Digamos que cu desenhe um triân- 
gulo na lousa. Descartes afirma que quem quer que olhe para a figura verá um 
triângulo levemente distorcido. O problema para ele é por que isso é verdadeiro. 
Por que concebemos a figura que vemos como um triângulo imperfeito e não 
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como um exemplar perfeito do que ela realmente é? Isso soa como uma questão 
um tanto tola, mas, como tantas outras questões tolas, é, em certo sentido, bas- 
tante profunda. A resposta cartesiana é que, dada a natureza da mente, figuras 
geométricas regulares são concebidas como modelos [ideais] para a interpre- 
tação da experiência; a mente simplesmente tem esse caráter. [...] Logo, somos 
compelidos a reconhecer qualquer figura que vemos como uma versão distorci- 
da da figura geométrica [ideal, inata], pois esse é essencialmente o modo como 
a mente funciona. 


Pois é, a rigor, nunca vimos um triângulo perfeito. Mesmo peças cortadas 
a laser por equipamentos de altíssima precisão têm uma margem de erro, 
ainda que pequena. Logo, nossa ideia de triângulo não é fruto de obser- 
vações da experiência. Quando crianças, muito antes das aulas de geo- 
metria no colégio, já sabemos exatamente o que é um triângulo, a ponto 
de classificarmos como tal uma peça de brinquedo triangular, mas com 
pontas arredondadas. Enfim, nossa “competência geométrica! opera com o 
triângulo idealizado, platônico. 

Permito-me tomar outros autores antigos — menos presentes na obra 
chomskyana* — como ponto de partida para a discussão sobre “inato versus 
adquirido” que se segue. 

Inspirando-se em passagens da obra ducentista Quaestiones disputatae 
veritate, de Tomás de Aquino, pensadores antigos cunharam a frase em 
(1), que se tornou motto para os defensores de que a mente humana nasce 
como uma tabula rasa: um repositório de ideias vazio, a ser preenchido 
com a experiência, por intermédio dos órgãos dos sentidos”. 


4. Para uma discussão mais detalhada, começando com as considerações de Descartes sobre 
o conceito mental do triângulo ideal, e culminando com considerações humboldtianas 
sobre linguagem, cf. Chomsky (1966a: 65-72). 


5. Há, no entanto, uma importante menção que Chomsky (1965: 50) faz a Leibniz, para 
além da frase aqui citada; bem como a referência feita a Leibniz em Chomsky (1966a: 63), 
em conexão com Menon, de Platão. 

6. Entre tais pensadores estão Pierre Gassendi, Francis Bacon, John Locke, e David Hume. 
Ironicamente, Tomás de Aquino, ele próprio, não endossava essa concepção sensista e em- 
piricista estrita, pois ele cria numa virtus activa inerente ao intelecto, responsável por 
abstrações generalizadoras. 


283 


(1) “Nihil est in intellectu quod non fuerit prius in sensu” 


Não há nada no intelecto que não tenha antes passado pelos sentidos. 


No início do século XVIII, Gottfried Leibniz se opõe frontalmente a essa 
posição em sua obra Nouveaux essais sur Pentendement humain, na qual ele 
retoma a frase em (1), substitui o ponto-final por uma vírgula, e continua 


a sentença magistralmente, como em (2). 


(2) “Nihil est in intellectu quod non fuerit prius in sensu, nisi intellectus ipse” 
Não há nada no intelecto que não tenha antes passado pelos sentidos, exceto 


o próprio intelecto. 


Essa versão modificada da frase original sintetiza bem a posição racio- 
nalista, compartilhada por vários pensadores antes e depois de Leibniz, e 
que se opõe ao sensismo e empiricismo estritos”. Note que, tal como origi- 
nalmente formulada, a afirmação de Leibniz não implica necessariamente 
a defesa de um inatismo forte, apenas se compromete com um inatismo 
fraco. Ou seja, não se segue de (2) que haja conhecimento inato de natu- 
reza específica a um tipo de tarefa (e.g. fazer contas, falar, caçar, coletar, 
construir e usar ferramentas, etc.). O que se defende é que os órgãos dos 
sentidos, por si mesmos, são incapazes de armazenar qualquer informação 
numa mente vazia. Para interpretar estímulos sensoriais como correspon- 
dentes a ideias, ou para formular ideias a partir deles, a mente deve, antes, já 
possuir ideias prévias, vieses, expectativas e processos estruturantes a partir 
dos quais generalizações e hipóteses poderão ser feitas, tendo a experiência 
sensorial como o fator deflagrador (cf. Fodor 1984). 

Chomsky vai bem além disso. Mas é preciso apreciar a importância, a 
magnitude e o impacto que a mudança de (1) para (2) representa historica- 
mente. Uma demonstração de que ao menos o inatismo fraco é inescapável 


7. Entre tais pensadores estão Platão, René Descartes, Baruch Spinosa e, de modo mais 
crítico, Immanuel Kant. 
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abre portas para contemplarmos a possibilidade do inatismo forte. De- 
ve-se ter em mente que o empiricismo estrito e o racionalismo coexistiram 
desde tempos remotos até recentemente. A última encarnação da defesa 
da tabula rasa seria, mutatis mutandis, o Behaviorismo (ou Comportamen- 
talismo). Skinner (1957) concebia a linguagem humana essencialmente 
como comportamento em vez de conhecimento (o que seria incompatível 
com a dicotomia competência/desempenho); colocando o peso explicativo 
na investigação do estímulo, na experiência, cuja natureza determinaria o 
comportamento, ignorando a contribuição do organismo para o processo. 
Em suma, a despeito de se autorrotular como uma teoria psicológica, o 
comportamentalismo skinneriano, na prática, não é uma investigação so- 
bre a mente propriamente; pois não fornece ferramentas concretas para tal, 
apenas tangenciando os eventos observáveis. Se essas afirmações parecem 
demasiado fortes e depreciativas, urjo a leitura da clássica e devastadora 
crítica de Chomsky (1959b) a Skinner (1957) para a argumentação com- 
pleta, bem como a apresentação didática de Lemle (2001). Para uma crítica 
panorâmica à crença na tabula rasa, recomendo Pinker (2002). 

A razão por que não dedico mais espaço à concepção de cognição ra- 
dicalmente empiricista é o fato de que isso é matéria vencida nos debates 
contemporâneos. Embora ainda haja muito debate, dissidência e até re- 
sistência apriorística quanto à perspectiva chomskyana-fodoriana de ina- 
tismo forte (i.e. módulos cognitivos estruturados a priori com conheci- 
mentos especializados para certas tarefas), os oponentes contemporâneos 
a essa visão são unânimes em defender que a mente humana não nasce 
como uma tabula rasa. É consenso atualmente que existe uma base cogni- 
tiva geneticamente determinada, própria da espécie homo sapiens sapiens, 
responsável pelo fato de nós sermos capazes de produzir e compreender 
enunciados linguísticos, diferentemente de quaisquer outras espécies (in- 
cluindo até outros primatas, nossos parentes mais próximos), cujos siste- 
mas de comunicação são qualitativamente muito diferentes, na maioria 
dos casos muitíssimo rudimentares em comparação com nossa lingua- 
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gem. O que distingue as abordagens inatistas fortes (ou simplesmente 
inatistas) das abordagens atualmente rotuláveis como não inatistas ou até 
anti-inatistas não é a aceitação ou rejeição da ideia de capacidades cog- 
nitivas inatas. Nesse sentido, a terminologia corrente pode ser um pouco 
confusa (Jean Piaget, por exemplo, preferia o termo hereditário em lugar 
de inato, talvez exatamente para evitar mal-entendidos). A diferença está 
nas concepções acerca da natureza e da abrangência mais estrita ou mais 
ampla dos vieses cognitivos apriorísticos, que o indivíduo já possui ao 
nascer, antes de qualquer experiência. 


55.2. O INTELLECTUS IPSE SERIA UM CANIVETE SUÍÇO OU UMA 
CAIXA DE FERRAMENTAS? 


Por um lado, os inatistas (ou nativistas) propõem que o intellectus ipse 
ao qual Leibniz se referira seria internamente estruturado em módulos, 
cada um deles com conhecimentos prévios específicos para a realização 
de certos tipos de tarefa, um deles sendo a GU, que teria certos princí- 
pios de organização próprios daquele domínio específico da cognição, não 
compartilhados com os demais domínios. Por outro lado, os oponentes 
ao inatismo consideram que esse intellectus ipse não seria especificamente 
premoldado para nenhuma tarefa cognitiva singular. Ou seja, haveria um 
corpo (pequeno) de mecanismos da inteligência geral aplicáveis a todo e 
qualquer domínio cognitivo. O inato (ou hereditário) seria uma capaci- 
dade geral de aprender qualquer coisa, detectar padrões, fazer associações, 
analogias, generalizações, etc. Essa capacidade, uma vez aplicada aos even- 
tos observáveis nos atos de fala, teria como consequência o desenvolvimen- 
to do conhecimento gramatical na mente de uma criança; passando por 
um estágio cognitivo intermediário a que Piaget chamou de noyau fixe (nú- 
cleo fixo), anterior à consolidação plena de uma gramática internalizada, 
porém contendo uma base estrutural para que isso se dê, de tal modo que 
essa base já se configura numa “base pré-gramatical”, que, segundo ele, não 


286 


seria hereditária, mas construída passo a passo a partir de bases cognitivas 
mais gerais, essas sim hereditárias”. 

No famoso debate com Chomsky, Jean Piaget articula seu discurso em 
torno de elementos oriundos de sua obra que supostamente definiriam a 
natureza desse noyau fixe fruto da cognição geral (ou o que supostamente 
explicaria os padrões de aprendizagem de estrutura gramatical do mesmo 
modo como ele supostamente teria explicado padrões de aprendizagem em 
outros domínios cognitivos). De saída, Piaget (1980a: 23-24) faz questão 
de marcar sua posição contrária ao sensismo e empiricismo estritos, afir- 
mando que “nenhum conhecimento é baseado apenas em percepções, já 
que estas são sempre guiadas e acompanhadas por esquemas de ação”. Um 
pouco adiante, Piaget (1980b: 57) completa: 


Eu concordo com Chomsky acerca do que eu vejo como a sua principal contri- 
buição para a psicologia, a saber: a linguagem é o produto da inteligência ou ra- 
zão, e não o produto do aprendizado no sentido comportamentalista do termo. 
Eu também concordo com ele quanto ao fato de que essa origem racional da 
linguagem pressupõe a existência de um noyau fixe necessário para a elaboração 
de todas as línguas, e pressupondo, por exemplo, a relação sujeito-predicado e a 
habilidade de construir relações. 


Partindo desse ponto, Piaget (1980a, 1980b, 1980c) apresenta uma sé- 
rie de conceitos que supostamente descreveriam a natureza do noyau fixe 
da cognição geral, e explicaria a aprendizagem de gramáticas. Entre esses 
conceitos estão esquema, assimilação, autorregulação, abstração refletora, ge- 
neralização construtiva e equilibração. 


8. Cowie (1999: 182-183, 193-196,213-215) propõe uma nova encarnação dessa ideia, disso- 
ciando inatismo de base cognitiva específica a um domínio. A autora rotula sua concepção 
de Empiricismo Iluminista, que consiste em admitir a existência de vieses especificamente 
gramaticais que guiam a aquisição de linguagem pelas crianças, sendo que esses vieses não 
seriam inatos, mas aprendidos pela experiência. Cowie, no entanto, não deixa nada claro 
qual seria o tipo da experiência necessária para tal aprendizado, nem quais estratégias ge- 
rais estariam envolvidas nisso, nem faz previsões concretas sobre padrões de aprendizagem 
quanto aos erros possíveis e impossíveis de ocorrer no percurso, nem quanto à duração 
de cada estágio. Em última instância, a proposta de Cowie é uma petição de princípio, um 
deus ex machina que nada explica. 
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Em diversos pontos do debate, Chomsky e Fodor argumentaram que 
aquilo que Piaget oferecia era uma mera conjectura incipiente acerca do 
tipo de teoria que ele vislumbrava e não se configurava sequer como uma 
hipótese propriamente formulada, muito menos como uma teoria efetiva- 
mente testada. Chomsky destacou que Piaget articulou todos aqueles con- 
ceitos in abstracto sem considerar nenhum fato concreto das gramáticas em 
geral ou de uma gramática particular, nem no plano da adequação descriti- 
va, muito menos no da adequação explicativa (cf. também Chomsky 1979: 
84-85). Já no início do debate, em resposta às colocações de Piaget (1980b), 
Chomsky (p. 64-65), define muito claramente a questão: 


Primeiramente, existe uma estrutura cognitiva fixa, um noyau fixe? A resposta 
é “sim”, nisso todos parecemos concordar. Em segundo lugar, [...| esse núcleo 
fixo — que eu suspeito corresponder ao que tenho chamado de GU nesse caso 
específico — emerge como um resultado de propriedades estruturais genetica- 
mente determinadas do organismo, ou decorreria, em cada caso particular, de 
mecanismos autorregulatórios? Devemos perseguir respostas para essa ques- 
tão, mas não através de especulações filosóficas, e sim através da observação de 
propriedades especificas do núcleo fixo. Então, indagamos como elas poderiam 
ter surgido através de mecanismos autorregulatórios, a partir de construções 
sensório-motoras, etc. Em suma, minha posição é que parece inconcebivel que 
haja qualquer relação significativa entre essas estruturas [gramaticais] especi- 
ficas [do núcleo fixo] e qualquer estrutura da inteligência sensório-motora ou 
propriedades gerais de mecanismos autorregulatórios. Contudo, não sou dog- 
mático quanto a essa questão: se alguém puder me mostrar que algumas das 
propriedades elementares da linguagem que acabo de discutir em [Chomsky 
(1980c)] é fruto de mecanismos autorregulatórios, eu ficaria encantado. Até lá, 
mantenho-me cético. 


Ao longo do debate, Chomsky (1980c, 1980d) apresentou alguns fatos 
gramaticais concretos, principalmente: (i) sensibilidade de relações de dêi- 
xis ao sujeito da sentença em que o elemento anafórico se encontra; e (ii) 
fronteamento de verbo auxiliar em sentenças interrogativas e o impacto 
da estrutura sintática global na seleção do auxiliar a ser fronteado. Primei- 
ramente, Chomsky argumentou que, no plano da adequação descritiva, o 
modelo de análise que ele propunha fazia previsões corretas quanto aos 
dados positivos e negativos sob o escopo do estudo daqueles fenômenos. 
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Ou seja, as regras gramaticais subjacentes aos padrões observados seriam, 
de fato, algo muito próximo do que ele propunha como formalização, qui- 
çá exatamente aquilo. Isso não foi contestado pelos participantes do debate. 

Uma vez estabelecido que as regras da gramática do falante adulto eram 
aquelas, Chomsky argumentou que suas propriedades não se seguem da 
chamada inteligência geral. Ou seja, aqueles padrões gramaticais específicos 
sob discussão não encontram correlatos em outros padrões detectados em 
domínios cognitivos distintos da linguagem. Esse ponto é crucial. Qual- 
quer defesa de uma concepção do intellectus ipse como um “canivete 
suíço” — i.e. uma base comum, não especializada, multitarefa — faz a forte 
previsão de que haveria enormes semelhanças entre todos os processos de 
aprendizagem. Na ausência de tal demonstração, a concepção inatista mo- 
dular não encontra sequer uma oposição genuína. 

Por fim, Chomsky argumentou que a experiência típica das crianças em 
contato com os atos de fala concretos que elas presenciam é tremendamen- 
te insuficiente para que elas pudessem inferir aquele tipo de conhecimento 
específico que elas teriam supostamente aprendido. Ou seja, a informação 
extraível da experiência efetiva (incluindo todo o entorno contextual para 
além das meras sentenças ditas) seria compatível com a internalização de 
muitos outros padrões gramaticais jamais atestados. Surpreendentemen- 
te, apesar dessas inúmeras possibilidades “no ar” todas as crianças, sem ti- 
tubear, internalizam o mesmissimo padrão, o qual nada indica se seguir 
naturalmente de propriedades gerais da cognição, dado não haver sequer 
vestígios desse mesmo padrão nos demais domínios cognitivos. 

Essa cadeia de raciocínio — que já havia sido apresentada antes sob algu- 
ma forma (e.g. Chomsky 1965: cap 1; 1967b; 1968: cap 2; 1971: cap 1; 1975b: 
cap 1; 1975d; Fodor 1967) — constitui a essência do chamado Argumento de 
Pobreza de Estímulo, do qual me ocuparei adiante em $5.5, e que, dentre 
os argumentos propostos a favor do inatismo gramatical, é o mais difun- 
dido e o mais discutido (consequentemente, o mais contestado e o que 
é mais frequentemente distorcido). No contexto daquele debate histórico 
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com Piaget, deve-se ressaltar que toda a parte empírica apresentada por 
Chomsky foi largamente ignorada pelos participantes do debate (com ra- 
ros momentos de exceção, com destaque para a reação de Hilary Putnam), 
que continuaram a debater o tema in abstracto, como se teorias pudessem 
ser discutidas à revelia dos fatos que elas almejam explicar. Os argumentos 
mais puramente lógicos articulados por Chomsky (1980c, 1980d), por Fo- 
dor (1980a) e por Chomsky & Fodor (1980), quando não foram também 
ignorados, foram largamente incompreendidos por Piaget e seus simpa- 
tizantes”. Na discussão que se seguiu à contribuição de Cellérier (1980a) 
àquele debate, o comentário de Dan Sperber (p. 78-80) foi uma honrosa 
exceção a essa reticência. 
Chomsky apresentou dados que qualquer teoria de aprendizagem deve explicar, 
bem como hipóteses inatistas que explicam esses dados. Se as hipóteses cons- 
trutivistas |piagetianas] não apresentam dados suplementares que invalidam as 
hipóteses inatistas, nem apresentam hipóteses alternativas; então só nos resta 
registrar a reticência dos construtivistas e sua esperança de um dia propor algo 


concreto e melhor. Porém, seguir esse debate como se estivéssemos diante de 
duas posições simétricas seria uma perda de tempo. 


O mesmo se pode atestar nas respostas de Chomsky (1980) e Fodor 
(1980b) às críticas de Putnam (1980a) ao inatismo. Chomsky (1980€: 310- 
311) resume bem o problema". 


A questão não é se uma base estrutural inata é ou não pré-requisito para a apren- 
dizagem; mas sim o que é essa base estrutural. [...] Por isso, eu nunca usei a ex- 
pressão “a hipótese inatista” ao defender minhas visões [...]. Como um princípio 
geral, comprometo-me apenas com uma postura de mente aberta relativamente 


9. O mesmo vale para neopiagetianos contemporâneos. A tese de doutorado de Graaf 
(1999) e o artigo de Eichler & Fagundes (2005) são dois exemplos emblemáticos de obras 
pretensiosas que ignoraram completamente os fatos e as análises, focando na acusação de 
que Chomsky, ao debater com Piaget, teria sistematicamente aplicado truques retóricos 
para forjar vitória num debate que ele teria perdido, por “fugir do ponto! Esses são mais 
exemplos do já mencionado problema de se pretender debater teorias ignorando suas co- 
berturas empíricas. 

10, Adiante, demonstro, com base em fatos gramaticais concretos, que Chomsky (1980e: 
311) estava correto — e ainda está — ao afirmar que as propostas dos oponentes da GU 
“[tJêm a forma de uma hipótese empírica, mas não têm o conteúdo de uma”. 
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à fase inicial geneticamente determinada para a aprendizagem de linguagem (a 
que chamo F/), e comprometo-me com uma hipótese explicativa particular 
a respeito de E! na medida em que essas assunções parecem plausíveis e empi- 
ricamente embasadas. Nas minhas contribuições a esse volume, delineei uma 
possível estratégia de investigação para determinar a natureza de F/ e esbocei 
umas tantas propriedades plausivelmente atribuíveis a F! seguindo essa estra- 
tégia. Putnam questiona um daqueles [meus] exemplos, a saber: a propriedade 
de “dependência de estrutura” que as regras sintáticas [transformacionais] têm, 
argumentando que meu ponto não fora estabelecido apropriadamente. Ele de- 
fende que essa propriedade específica deriva da “inteligência geral”, Se ao menos 
Putnam pudesse caracterizar de algum modo “inteligência geral” ou “estratégias 
de aprendizagem multitarefa”, e indicar, ainda que vagamente, como a proprie- 
dade de dependência estrutural das regras |transformacionais] se seguiriam da 
assunção de que a estrutura inata seria como ele a caracteriza; eu teria o maior 
prazer em contemplar a possibilidade de que a propriedade de dependência es- 
trutural possa ser atribuída à “inteligência geral” e não à F!, contrariamente ao 
que ora defendo. Obviamente, isso não implicaria nada a respeito das demais 
propriedades que eu proponho que podem ser atribuídas a E!. Além do mais, se 
puder ser demonstrado que todas as propriedades de F! puderem ser atribuídas 
à “inteligência geral”, uma vez que essa noção misteriosa fosse de algum modo 
clarificada, eu irei efusivamente concordar que a faculdade da linguagem não 
possuiria propriedades especiais. Mas Putnam não oferece sequer uma vaga e 
imprecisa sugestão quanto à natureza da “inteligência geral” ou “estratégias de 
aprendizagem multitarefa” que ele acredita existirem. Logo, não podemos ava- 
liar a sua asserção de que uma propriedade específica de E! pode ser explicada 
em termos daquelas noções gerais. 


No debate, Fodor (1980a) vai além de Chomsky e argumenta contun- 
dentemente que não se trata apenas de Piaget e seus simpatizantes não te- 
rem oferecido uma teoria geral de aprendizagem (aplicável à linguagem 
ou a qualquer outro domínio cognitivo), tendo só acenado (através de um 
jargão) com promessas de um dia construir uma teoria como a que eles 
imaginam. Fodor disseca a lógica deficiente por trás da noção piagetia- 
na de que estruturas mentais mais complexas seriam construídas a partir 
de estruturas mentais prévias, menos complexas. Em termos filosóficos e 
matemáticos (portanto, abrangendo questões de “aprendizagem” relativas a 
qualquer domínio cognitivo), o autor demonstra que o grau de complexi- 
dade de qualquer esquema mental atingido a posteriori não teria como ter 
sido logicamente construído apenas com base na complexidade inferior 
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do esquema mental anterior aplicada à experiência sensorial. Fodor de- 
monstra ser logicamente impossível haver qualquer teoria de aprendiza- 
gem propriamente dita, pois o que chamamos vulgarmente de aprendiza- 
gem seria, a rigor, fixação de crenças, a partir da corroboração ou refutação 
de hipóteses construídas com os meios mentais já presentes na mente nos 
estágios anteriores ao suposto “aprendizado: Sem o caráter apriorístico de 
tais meios, não há qualquer possibilidade de avanço, construção, aprendi- 
zado ou mudança de estado mental. Essa breve nota sobre Fodor (1980a) 
não pretende convencer você a aderir à perspectiva fodoriana. Apenas 'fiz 
propaganda! daquela visão, sem demonstrar o passo a passo da argumen- 
tação, que não cabe neste capítulo. Meu objetivo é provocar você a ler esse 
clássico tão importante dos estudos de cognição, e que infelizmente tem 
sido ignorado até por ditos especialistas. 

Uma forte objeção de Piaget ao inatismo diz respeito ao que ele via 
como um problema insolúvel por definição, concernente ao surgimento, 
no curso da evolução da espécie, dos correlatos neurofisiológicos da GU, 
que Chomsky propunha serem exclusividade dos humanos. Como vimos 
em $2.6 e $2.8, a proposta de que o intellectus ipse contém uma GU implica 
que haveria estruturas biológicas correlatas à GU, presentes de algum modo 
no código genético. Isso nos impõe a dificílima tarefa de ultrapassar o ní- 
vel da adequação explicativa e, a longo prazo, caracterizar as propriedades 
neurofisiológicas do aparato cerebral associado à GU, bem como explicar 
as origens e o desenvolvimento evolutivo desse aparato em termos cladísti- 
cos rigorosos. Piaget (1980b: 29-31, 59-61) corretamente apontou que a pro- 
posta chomskyana de GU não trazia em si nenhuma explicação acerca das 
origens e do desenvolvimento dessa GU na linhagem evolutiva do homo sa- 
piens sapiens. Daí, ele conclui que a hipótese da GU é “inexplicável” em 
termos evolutivos. Chomsky (1980c: 36) responde à objeção piagetiana — 
retomando o ponto adiante (p. 73-74) em resposta a Cellérier (1980a) — argu- 
mentando que o fato de a evolução da GU na linhagem da espécie ainda ser 
inexplicada não implica que ela seja, em princípio, inexplicável. Ele apon- 
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ta, inclusive, que não existem explicações acerca da evolução de órgãos do 
corpo humano cuja fisiologia se conhece bem. Conforme a hierarquia dos 
níveis de adequação (cf. $2.6 e $2.8) é preciso primeiramente atingir os 
níveis de adequação descritiva e explicativa para só então buscar atingir a 
adequação supraexplicativa. Acrescento a essa resenha um outro ponto que 
passou despercebido naquele debate. Digamos que Piaget tivesse razão, e os 
humanos sejam dotados de um intellectus ipse do tipo canivete suíço) cujas 
propriedades teriam sido explicitadas, e cuja aplicabilidade aos fatos de in- 
ternalização de gramática teria sido demonstrada com forte embasamento 
empírico. Isso, por si só, explicaria a evolução dos correlatos neurofisioló- 
gicos do 'canivete suíço” na espécie? Não! Logo, a demanda de Piaget era 
precipitada e injusta, pois a sua visão enfrentava, em maior grau, o mesmo 
problema enfrentado pela de Chomsky. 

Apreciemos agora um raciocínio geral elaborado em detalhe por 
Chomsky (1975b: 10-35) e resumido em Chomsky (1980c: 35-39), no de- 
bate com Piaget. Partamos de (3): 


(3) E+ESE, 


Nesse esquema, 'F” é uma fase qualquer do desenvolvimento cognitivo, um 
estágio em que se encontra a mente quanto ao conhecimento (geral ou es- 
pecífico) nela representado. Os índices subscritos “? e 'f” indicam, respec- 
tivamente, o estágio inicial da mente do recém-nascido e o estágio estável 
que a mente atinge, que se caracteriza pelo domínio de todos os mecanis- 
mos gramaticais de uma Língua-l plena, logo, o estágio final, por equivaler 
a uma gramática adulta. “E' é a experiência do aprendiz, toda a miríade de 
atos de fala que a criança testemunhou no intervalo de tempo entre F, e 
E, constituindo-se assim na sua experiência linguística. A natureza exata 
de E, embora não totalmente desvendada, é, em muitos aspectos, bem co- 
nhecida dados os avanços nos estudos gramaticais no plano da adequação 
descritiva. Ou seja, pondo de lado questões espinhosas e misteriosas, sabe-se 
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o suficiente sobre o funcionamento da gramática (i.e. regras fonológicas, 
morfológicas e sintáticas). 

A natureza exata de E evidentemente varia de um indivíduo para ou- 
tro, em maior ou menor magnitude, a depender do ambiente em que os 
indivíduos cresceram. Não obstante, através de métodos triviais de coleta 
de amostras de fala dirigida a crianças, bem como de descrições fornecidas 
por dialetólogos, é possível termos uma boa ideia aproximada do que seria 
a experiência típica de uma criança que cresce em Curitiba, Okinawa ou 
Frankfurt, e que nada mais seria que uma coleção de enunciados possíveis 
das extensões das Línguas-l que compõem a Língua-E de cada uma dessas 
comunidades linguísticas. 

Considerando que F, é o resultado da interação entre a contribuição do 
organismo (i.e. E, seja isso um “canivete suíço" ou uma “caixa de ferramen- 
tas) e a contribuição do ambiente (i.e. E), então a nossa tarefa de atingir 
o nível da adequação explicativa consiste em descobrir a natureza da parte 
desconhecida, i.e. F, a partir das partes razoavelmente conhecidas. Isso se 
faz formulando hipóteses acerca do que há ou não há (de geral ou especiífi- 
co) em F, e subsequentemente testando as previsões que cada hipótese faz 
acerca de F, verificando se o previsto corresponde ao atestado nos níveis 
observacional e descritivo. 

É importante ter em mente que, a despeito desse estilo chomskyano de 
apresentação, a questão subjacente é rigorosamente a mesma enfrentada 
por qualquer investigador de aquisição de linguagem, em qualquer verten- 
te teórica. A fórmula em (3) é neutra na medida em que não se comprome- 
te com o caráter geral ou específico dos vieses apriorísticos de F,. Seguindo 
esse raciocínio, Chomsky (op. cit.) delineou como se seguem as diretrizes 
do debate acerca do que se chamava à época de Teorias de Aprendizagem. 
Considere agora (4): 


(4a) TA (H,L);  (4b) TA (H,N); (4c) TA (H,D); (4d) TA (O,D) 
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Em (4), TA significa teoria de aprendizagem; e os membros do par orde- 
nado a seguir são o tipo de organismo (ou espécie) do indivíduo aprendiz e 
o domínio da cognição em questão, i.e. o conhecimento a ser consolidado 
com o aprendizado. H significa humanos, L significa linguagem, N significa 
navegação: i.e. habilidade de se locomover no espaço sem se perder (cf. Gal- 
listel 1990, cap 3). O corresponde a todo e qualquer organismo (espécie), e 
D a todo e qualquer domínio cognitivo. Assim, (4a), (4b), (4c) e (4d) se- 
riam, respectivamente (i), uma teoria da aprendizagem de linguagem por 
humanos; (ii) uma teoria da aprendizagem de navegação por humanos; 
(iii) uma teoria da aprendizagem de conhecimento em todo e qualquer 
domínio cognitivo por humanos; e (iv) uma teoria de aprendizagem de 
conhecimento em todo e qualquer domínio cognitivo por todo e qualquer 
organismo vivo. 

(4c) é a utopia de Piaget e dos anti-inatistas contemporâneos, consubs- 
tanciada sob várias formas em obras diversas como Elman et al. (1996), 
Cowie (1999), Sampson (2005), Tomasello (2003), Prinz (2012), Everett 
(2012), Evans (2014a), inter alia". A despeito de importantes diferenças 
entre si, todas essas propostas sofrem do mesmo mal do projeto piagetiano. 
Ou seja, esses arcabouços teórico-metodológicos, além de questionáveis 
em termos puramente conceituais, não têm o alcance empírico necessário 
para se qualificarem como adversários reais da tese inatista chomskyana- 
-fodoriana, pois suas visões astigmáticas não enxergam a realidade do Pro- 
blema de Platão (cf. $5.1), não reconhecem que o estímulo é pobre, i.e. que 
a informação contida em E é insuficiente para que se possa inferir F, sem 
que F, já codifique conhecimento especificamente gramatical. Suas hipóte- 
ses acerca do conteúdo de F, não fazem previsões corretas acerca daqueles 
fatos gramaticais específicos apontados pelos chomskyanos e que são cruciais 


11.Sou obrigado a incluir nessa lista uma obra pré-GGT, Linguagem e Pensamento de Vy- 
gotsky (1934), tamanha a influência que ela tem entre educadores (incluindo formadores 
de professores de língua), tanto quanto as obras de Piaget têm. Ambos os autores teorizam 
sobre o tema com uma base empírica frágil, praticamente nula. 
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por serem eles o que motiva e justifica a postulação dos princípios da GU 
que são mais ou menos consensuais entre os praticantes da GGT. 

Obviamente, o que acabo de dizer é um conjunto de asserções sem a 
devida demonstração, a qual demandaria um espaço de que não disponho. 
Estou consciente do risco que corro ao omitir da discussão detalhes desses 
trabalhos recentes. Mas a escassez de papel e tinta não é o único motivo. 
Não acredite cegamente em minha palavra, caro leitor. Convido você a pe- 
netrar nessa literatura técnica e verificar por si mesmo que, apesar das dife- 
renças técnicas e empíricas, trata-se do velho e fracassado sonho piagetiano 
de ter uma teoria geral de aprendizagem, incorrendo nos mesmos erros. 
Quem quiser entender as discussões contemporâneas sobre inatismo não 
pode deixar de ler o livro daquele histórico debate entre Piaget e Chomsky, 
em que já havia muitas perguntas e respostas hoje apresentadas como se 
fossem novidades. Omito as críticas mais recentes por minha conta e ris- 
co", Se você não ler aquele livro histórico, cultive essa lacuna abissal em sua 
formação por sua conta e risco. 

(4d) é uma utopia maior ainda, que, até onde eu sei, jamais foi levada a 
cabo, exceto enquanto débeis e estéreis quimeras de comportamentalistas 
ingênuos, que não viam muita diferença entre humanos e os cães pavlovia- 
nos, e que não chegaram a resultado algum. 

(4a) é o que podemos chamar de sonho chomskyano: um sonho que 
tem se mostrado cada vez mais possível de ser alcançado, ainda que cer- 
tos detalhes possam permanecer eternamente misteriosos. (4b) é um en- 
tre muitos exemplos de teoria de aprendizagem específica perseguida por 
quem compartilha a visão chomskyana-fodoriana de mente modular (cada 
módulo correspondendo, na analogia que ofereço, às gavetinhas dedica- 
das a cada tipo de utensílio na “caixa de ferramentas"). Entre os estudiosos 
da habilidade de navegação (principalmente em insetos, no entanto) está 


12. Em outros trabalhos meus, eu confronto diretamente anti-inatistas contemporâneos. 
Por exemplo, em Guimarães (2007) eu discuto Geurts (2000), e em Guimarães (2013) eu 
discuto Everett (2005, 2006). 
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o brilhante etólogo Charles Randy Gallistel, uma figura ímpar na ciência 
cognitiva atual, a quem retornarei em breve. 

Num certo sentido, a utopia em (4d) é legítima, pois se aproxima do 
ideal científico da “teoria de tudo” em que se explica muita coisa através de 
poucos meios. Tanto quanto for possível perseguir teorias assim, não de- 
vemos nos acovardar, devemos tentar persegui-las. Entretanto, a realidade 
é o que é, e, como veremos já a partir da próxima seção, diferentes do- 
mínios cognitivos exibem propriedades nitidamente distintas, sugerindo 
fortemente que precisamos de teorias distintas para abordá-los. Sob essa 
Ótica, o objetivo piagetiano revela-se mesmo utópico e inviável, como de- 
monstrarei em breve. A tese de Chomsky e Fodor no debate era — façamos 
justiça — a menos megalômana, a mais realista e exequível à época. 

Apesar desse caráter modesto, iniciou-se ali a difusão da ideia ousada 
de que a GU corresponderia a um órgão do corpo humano, numa discus- 
são entre Chomsky (p. 75-78) e demais participantes do debate, com base 
na contribuição de Cellérier (1980). A partir daquele ponto, tornou-se 
aos poucos mais comum falar do conhecimento gramatical como um ór- 
gão que “cresce no organismo sendo “alimentado” por estímulos externos, 
em vez de algo vindo de fora e que se instala na mente por intermédio dos 
sentidos. Com o advento do PM e do boom da Biolinguística, no final 
do século XX, essa concepção se tornou hegemônica na GGT (cf. Ander- 
son & Lightfoot 2002). Tamanha era a pertinência, a correção, a lucidez e 
o caráter visionário de Chomsky e Fodor naquele debate, que podemos 
reconhecer suas impressões digitais no estado da arte das ciências naturais 
contemporâneas, particularmente nessa passagem magistral de Gallistel 
(2006: 1-3): 


Pelo senso comum, a aprendizagem seria mediada por poucos processos, ne- 
nhum dos quais especializado para aprender um tipo particular de conteúdo. 
[...] Esses processos gerais de aprendizagem teriam propriedades e efeitos com- 
portamentais, mas não envolveriam funções computacionais específicas, nem 
teriam estruturas que os habilitariam a executar tais computações. Conforme 
a visão associativa de aprendizagem, o cérebro é maleável, e se reorganiza para 
se adaptar à experiência. Não haveria órgãos de aprendizagem específicos para 


297 


uma tarefa computando representações de diferentes aspectos do mundo a par- 
tir de diferentes aspectos da experiência. Chomsky, em oposição, sugere que a 
aprendizagem é mediada por órgãos de aprendizagens distintos, cada um com 
uma estrutura que lhe permite aprender um tipo próprio de fatos contingentes 
da realidade. Aqueles não contingentes, as verdades universais, não são apren- 
didas; estão implícitas na estrutura dos órgãos de aprendizagem, que possibilita 
a cada órgão aprender os fatos contingentes que lhe são próprios. A sugestão 
chomskyana brotou de sua constatação de que aprendizagem é um problema 
computacional [..]. O aprendiz deve computar a partir dos dados uma repre- 
sentação de um sistema que gere os dados. Chomsky lidou majoritariamente 
com o aprendizado de linguagem. Aprender linguagem é, pois, computar, a par- 
tir de poucos enunciados, não raro fragmentados e/ou agramaticais, a gramática 
do sistema que gera todas e apenas as sentenças bem-formadas da língua. O 
desafio computacional que isso coloca é tão gigantesco que não há esperança de 
superá-lo sem um órgão de aprendizagem específico para uma tarefa, um órgão 
computacional cuja estrutura é especialmente adaptada para as demandas desse 
domínio cognitivo particular. Quer esse órgão resida num local altamente isola- 
do do cérebro, quer ele emerja de interconexões linguísticas de diversos módu- 
los processadores de dados no cérebro, isso é irrelevante quanto a ele constituir 
um órgão distinto ou não. Uns órgãos são localizados (e.g. os rins) enquanto 
outros se ramificam por toda parte (e.g. o sistema circulatório). A propriedade 
essencial de um órgão é que ele tem uma função distinta da função de outros 
órgãos, e uma estrutura apropriada para tal função, a estrutura que o possibili- 
ta executar sua tarefa. Chomsky (1975b), embora tenha lidado primariamente 
com linguagem, claramente notou que sua concepção computacional de apren- 
dizagem implica que outras formas de aprendizagem seriam mediadas por ór- 
gãos de aprendizado adaptados para problemas específicos. Do ponto de vista 
computacional, a noção de um processo de aprendizagem de caráter geral (e.g. 
aprendizagem associativa) não faz mais sentido que a noção de um órgão geral 
dos sentidos — uma protuberância na testa cuja função é sentir qualquer coisa. 
Não há tal órgão, pois detectar informação de tipos diferentes de estímulo — lu- 
minoso, sonoro, químico, mecânico, etc. - requer órgãos com estruturas molda- 
das por propriedades específicas do estímulo que eles processam. À estrutura de 
um olho — incluindo os circuitos neuronais na retina e além dela — refletem em 
detalhes finos as leis da ótica e as demandas da extração de informação sobre 
o mundo a partir da luz refletida. O mesmo vale para o ouvido. As demandas 
de extração de informação a partir dos sons dita as muitas idiossincrasias dos 
órgãos auditivos. Enxergamos com os olhos e escutamos com os ouvidos, e não 
através de um órgão dos sentidos geral, pois sentir requer órgãos com estruturas 
específicas a cada modalidade. Chomsky concluiu que o mesmo deve valer para 
a aprendizagem. Aprender coisas diferentes através de diferentes tipos de expe- 
riência requer computações moldadas tanto para o que há de se aprender como 
para o tipo de experiência através da qual o aprendizado se dá. Logo, deve haver 
órgãos de aprendizagem específicos para uma tarefa, igualmente moldados em 
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ambos esses sentidos. Por razões computacionais, espera-se que haja diferenças 
entre órgãos de aprendizagem de espécies animais distintas, tanto quanto há 
entre os órgãos sensoriais, Diferentemente de nós, os crotalíneos percebem ra- 
diação infravermelha, porque eles têm um órgão sensorial que não temos. Nós 
aprendemos línguas e chimpanzés não, pois eles não têm o órgão de aprendiza- 
gem de línguas que nós temos. Chomsky argumentou que haveria outros órgãos 
de aprendizagem, mas não especificou em que outros domínios eles atuariam. 
Agora podemos fazer isso. Assim, podemos tornar clara a natureza computacio- 
nal da aprendizagem, que implica órgãos de aprendizagem, mecanismos cere- 
brais que implementam um tipo particular de computação sobre dados de um 
tipo particular. 


85.3. APRENDIZAGEM POR INDUÇÃO? 


Ponha-se no lugar de alguém que nunca comeu um brigadeiro. E agora 
você passa pela experiência de comer 137 brigadeiros em sequência", i.e. 
<B, B, B,B, B,..,B,,>. Você então constata que todos os brigadeiros 
(Bs) que você comeu tém sabor doce (tal qual goiabadas e quindins, e dife- 
rentemente de limões ou acarajés, por exemplo). Dessa observação, deriva 
um conhecimento de mundo recém-adquirido, representado em (5). Mas 
você não para aí; faz um salto indutivo, inferindo, a partir de (5), que a 
asserção em (6) é verdadeira. Você, mesmo sem ter comido todos os briga- 
deiros, toma a doçura como propriedade inerente a todos eles, e não como 
uma característica contingencial de alguns. 


(5) B, é doce, B, é doce, B, é doce, B, é doce, B, é doce, 
(6) Todo brigadeiro é doce. 


Esse salto indutivo não se segue apenas das suas experiências com o 
mundo. Se fosse assim, você não chegaria à conclusão em (6), mas a outra, 
menos abrangente, como em (7): 


13. Isso não implica que as degustações de brigadeiro não possam se intercalar com expe- 
riências de outros tipos. 


299 


(7) Todos os 137 brigadeiros que eu comi eram doces; quanto aos demais, não sei. 


Ou seja, ainda que (6) seja verdadeiro", o fato é que o aprendizado disso 
não tem como ocorrer sem que — para além, é claro, da crucial experiência 
sensorial e memorização — haja também um viés cognitivo apriorístico: uma 
tendência a se fazer saltos indutivos de (8a) para (8b). Isso, por si só, é um 
saber instintivo: algo que você não aprendeu, nasceu sabendo. 


(8a) Todos os exemplares da coisa X que eu conheci têm a propriedade Y. 
(8b) Todo exemplar da coisa X tem a propriedade Y. 


Nada disso implica que você nasceu sabendo que (6) é verdadeiro, nem 
mesmo que já sabia o que é um brigadeiro ou a doçura”. Aparentemente, 
você de fato aprendeu que (6) é verdadeiro. Mas tal aprendizado claramen- 
te não se deu apenas pela sua experiência. Para chegar lá, você utilizou um 
saber mais geral, esse sim instintivo. Ou seja, tudo indica que você nasceu 
sabendo fazer saltos indutivos. Sem eles, é impossível extrapolar a experiên- 
cia testemunhada e detectar padrões e generalizações sobre o mundo além 
do “aqui e agora” Afinal, aprender é extrapolar da experiência específica 
para o conhecimento geral. 

Quaisquer que sejam os detalhes finos dos saltos indutivos, é fato que 
fazemos isso frequentemente ao desvendarmos aspectos desconhecidos do 
mundo. Em (8), as asserções estão formuladas de modo abstrato e genérico 
(i.e. não dizem respeito especificamente nem a comida, nem a música, nem 
a linguagem, etc.). Como vimos, há fortes indícios de que a mente humana 
nasce 'pré-programada' para saltar de (8a) para (8b) quando o número de 


14. Ignoro aqui receitas exóticas, como uma que preveja cristais de sal grosso em lugar de 
chocolate granulado. Consideremos que isso não é um brigadeiro genuíno, e concentre- 
mo-nos nos brigadeiros canónicos apenas. 

15. É preciso, no entanto, saber previamente o que seriam coisas, propriedades de coisas, 
totalidade, ete. 
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exemplares de X for suficientemente grande para ser tomado como repre- 
sentativo do todo. Há nisso um ponto complexo que foge ao escopo deste 
capítulo: quantas observações seriam suficientes para o aprendiz se sentir 
seguro para realizar o salto? Não há um “número mágico" aplicável a todas as 
situações. Isso varia muito com o contexto. Sigamos o raciocínio admitindo 
que, em qualquer aprendizado, haverá um ponto que legitimará o salto. 

A conclusão parcial até aqui é que, no mínimo, nascemos sabendo fazer 
esse salto indutivo. Somos enviesados para acreditar que, na ausência de 
evidência em contrário, se (8a) é verdadeiro, então (8b) também é; quais- 
quer que sejam as coisas e propriedades que instanciem X e Y. Esse conheci- 
mento instintivo não é um conhecimento do mundo; é um conhecimento 
das nossas próprias estratégias de aprendizagem (mas que pressupõe uma 
certa concepção abstrata, idealizada, do mundo). É um conhecimento do 
nosso próprio intelecto, ainda que não consciente. É, enfim, um conheci- 
mento de como se estruturam nossas representações mentais do mundo 
exterior. Mas esses saltos não são irreversíveis. Na presença de evidência 
em contrário, nosso instinto é concluir que nossa generalização foi longe 
demais, e formular uma nova generalização. Relato uma experiência pes- 
soal que ilustra esse ponto. Quando criança, por muito tempo, acreditei 
que toda maçã era vermelha. Quando vi pela primeira vez uma maçã verde, 
fiquei muito surpreso. Aquilo contradizia frontalmente algo que eu cria 
fortemente ser uma verdade absoluta. Diante da nova experiência, mudei 
de ideia quanto às propriedades essenciais e contingenciais das maçãs. 

Uma questão fundamental nisso tudo diz respeito aos limites da indu- 
ção: que tipos de salto seriam possíveis ou não. Saltamos naturalmente de 
(5) para (6). Porém, salvo diante de circunstâncias bem específicas, jamais 
saltamos de (5) para nenhuma das conclusões em (9). 


(9a) Todo brigadeiro é doce, exceto se ele for feito após a minha morte. 


(9b) Todo brigadeiro é doce, exceto se ele for comido numa espaçonave no espaço 


sideral. 
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(9c) Todo brigadeiro é doce, exceto se ele tiver volume maior que 40m'. 
(9d) Todo brigadeiro é doce, exceto se ele foi guardado numa caixa de chumbo 
azul oval. 


A menos que as circunstâncias em que você comeu brigadeiro tenham 
sido muito excepcionais, todas as asserções em (9) são extrapolações 100% 
compatíveis com a sua experiência. Por exemplo, se você nunca comeu um 
brigadeiro no espaço, como saber se o sabor é doce ou não? Mesmo sem ter 
como aferir isso, você assume em princípio que (9b) é falso; que também lá 
os brigadeiros seriam doces, como todo e qualquer brigadeiro. Mas como 
você sabe que todo e qualquer brigadeiro é doce? Esse saber vem do salto 
indutivo em (6) que extrapolou sua experiência imediata. A rigor, não é 
um saber, é uma crença forte'. Note que o salto em (6) não é a priori me- 
nos extrapolativo nem menos arriscado que qualquer dos saltos em (9). 
De qualquer maneira, está-se afirmando algo sobre brigadeiros ainda não 
observados serem doces ou não. Porém, na prática, consideramos (6) como 
um salto natural, e os saltos em (9) como absurdos”. Empiricamente, não 
há razão para tal distinção; mas, em termos estritamente formais, há uma 
diferença entre (8), que subjaz ao salto (6) efetivamente executado, e (10) 


abaixo, que subjaz aos saltos impossíveis em (9). 


16. Em Guimarães (2007), demonstro que a distinção entre conhecimento e crença é cru- 
cial para se evitar incompreensões grosseiras do inatismo, como a de Geurts (2000). 

17. Lembre-se de que às vezes o que parece absurdo pode ser verdade. Embora não con- 
firmado pelo posicionamento oficial da NASA (cf. http://spaceflight.nasa.gov/shuttle/ 
reference/factsheets/food.html), o astronauta brasileiro Marcos Pontes afirmou numa 
entrevista concedida à Rádio Jovem Pan em 31/03/2016 que, devido a circunstâncias ex- 
cepcionais internas e externas ao organismo humano, “toda comida tem gosto de papel” 
numa missão espacial. Não sei o quão verdadeira é essa afirmação, nem os motivos disso. 
O que nos interessa aqui é que, ao menos potencialmente, as referidas circunstâncias espe- 
ciais poderiam alterar propriedades químicas dos alimentos ou o nosso paladar. Mas uma 
pessoa leiga nesses assuntos jamais aposta na generalização em (9b) por salto indutivo, sem 
evidências. É preciso ter a experiência adequada. 
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(10a) Todos os exemplares da coisa X que eu conheci têm a propriedade Y. 

(10b) Todo exemplar da coisa X tem a propriedade Y; exceto se o exemplar de X 
em questão pertencer à subclasse ainda não observada dos Xs que têm a 
propriedade Z. 


A diferença entre (8b) e (10b) está na ausência ou presença de uma cláu- 
sula adicional que especifica uma subclasse de exceção à generalização que 
se faz. Do ponto de vista estritamente formal — independentemente do con- 
teúdo específico da cláusula restritiva — saltos derivados da fórmula geral 
em (10b) são inerentemente mais complexos que aqueles que derivam de 
(8b). Aparentemente, nossas mentes são enviesadas para (i) realizar saltos 
indutivos e extrapolar a experiência, vertendo observações em conhecimen- 
to (a rigor, crença); e (ii) preferir saltos indutivos mais simples, sem cláusulas 
de exceção. Aliás, o item (ii) faz bastante sentido a partir do momento que 
reconhecemos que, para toda e qualquer extrapolação que fizermos, há um 
número literalmente infinito de cláusulas de exceção logicamente possíveis 
de serem levadas em consideração. O que nos faria, por exemplo, preferir 
(9b) em detrimento das três opções anteriores, ou de qualquer outra ima- 
ginável? Certamente, nenhuma evidência empírica observável nos aponta 
tal caminho. Estar enviesado a favor de uma cláusula de exceção específica 
implicaria que esse viés seria mais que meramente formal: seria um viés ba- 
seado no conteúdo específico daquela cláusula. Ou seja, o aprendiz teria que 
nascer pré-programado com ideias sobre uma relação entre a doçura dos 
brigadeiros e viagens espaciais — para ficar só no exemplo (9b). 

No que se segue, assumo, por conveniência expositiva, que saltos in- 
dutivos do tipo (8) são formas possíveis de estratégias cognitivas gerais 
de aprendizagem. No entanto, urjo que o leitor aprecie em detalhe Fodor 
(1980a, 1984) e sobretudo Chomsky & Fodor (1980), em que os autores ar- 
gumentam — elaborando a partir de Goodman (1955) e Hempel (1965) — 
que nenhuma indução é possível se não houver, de saída, vieses cognitivos 
apriorísticos muito mais fortes e específicos que (8), caso contrário che- 
ga-se a um paradoxo fatal. 
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Antes de mudar de seção para apreciarmos fatos gramaticais concretos 
que são apresentados pelos inatistas como evidência empírica em favor da 
tese da GU, trago um último argumento lógico abstrato que será retomado 
adiante. Ilustro o ponto através de uma situação com grau de complexida- 
de bem baixo. Retomo a analogia que apresentei em $4.5 entre expressões 
da linguagem natural e sequências de caracteres aceitas ou não por sistemas 
de computadores para identificar usuários. Digamos que você seja infor- 
mado que um dado sistema informatizado aceita como “identificador de 
usuário” (ID) sequências de símbolos de um tipo bem específico, havendo 
restrições quanto às combinações de caracteres admissíveis. Nada mais lhe 
é dito. Ou seja, você não sabe qual é a magnitude dessas restrições, o quão 
complexas ou simples são as regras que proíbem e permitem tipos de se- 
quências. Alguém lhe apresenta a lista em (11), que contém IDs já registra- 
dos no sistema, e lhe diz que você pode escolher para si qualquer outro ID 
diferente daqueles, mas que seja do mesmo tipo. 


(11) Bogas af, af, Bar, afBata pat, e BatfosBatosBor apoios, 
BotfatorBarforBaao. 


Mas o que seria um ID do mesmo tipo? Não há como saber. Podemos 
apenas hipotetizar com base em propriedades comuns a todos os IDs em 
(11), de acordo com o que tomarmos como relevante. Venho praticando 
esse experimento informal em sala de aula há quinze anos. Os resultados 
variam pouquíssimo quanto à reação dos alunos. Embora as respostas não 
sejam 100% convergentes, a grande maioria enxerga em (11) um mesmo 
padrão. Primeiramente, eu peço para que os participantes não revelem a 
ninguém o que eles pensam ser(em) a(s) regra(s) combinatória(s) que de- 
termina(m) os tipos admissíveis de sequência. Em seguida, eu lhes peço 
que deem exemplos de sequências que seriam IDs válidos segundo a(s) re- 
gra(s) hipotetizada(s). A resposta típica da maioria é algo como (12). 


(12) oBaB, B, Ba, BaBaBoBo, aBoBapaBo, BoBaf, BabaBoBof, 
aBaBo, Boofo 
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Em seguida, pergunto o porquê de eles terem escolhido essas sequências 
e não outras. Em outras palavras, qual(quais) seria(m) a(s) regra(s) que 
eles extraíram a partir de (11)? A grande maioria me responde que o fato de 
as várias IDs em (11) conterem apenas os símbolos « e 2 sugere fortemente 
que isso não é mero acaso (senão a amostra provavelmente traria IDs com 
outros símbolos, como y, Ô, 3, 4, &, %, Pp, q, por exemplo); logo, é mais 
seguro apostar na hipótese de que apenas esses dois símbolos são válidos. 
Isso, por si só, é um salto indutivo. Não há qualquer evidência cabal de que, 
por exemplo, yôyôyô, não possa ser um ID válido. Contudo, a maioria não 
realiza tal salto. Além disso, os participantes majoritariamente me dizem 
que perceberam que, em toda a amostra, os IDs traziam os símbolos a e 
 sequenciados sempre de modo alternado; o que sugere haver um padrão 
subjacente, caso contrário, seria esperado que a amostra tivesse exemplos 
como aBBBea, ou cur, por exemplo. Novamente, trata-se de um salto 
indutivo, uma generalização a partir de uma amostra, sem uma prova cabal 
de que a alternância é obrigatória. Em ambos os casos, há a intuição de que 
“não parece ser por acaso, senão teriam aparecido exemplos diferentes”. 

Em seguida, eu sinalizo os itens de (12) que — segundo o código ain- 
da mantido em sigilo — não são IDs válidas, riscando-os da lista, como 
em (12): 


(127  afaf, E, Pab, Papaporo, apofapapaf, Befef, Pere, 
afapaf, Bopofa 


Nesse momento, após uma breve reflexão, os participantes desvendam 
a parte do código que faltava ser desvendada, i. 


“se a sequência começa 
com 3, não pode terminar com )”. Eu então lhes digo que eles estavam cer- 
tos quanto a (i) “os símbolos válidos serem apenas « e 3”; e (ii) “nenhuma 
ocorrência de um símbolo pode estar adjacente a outra ocorrência do mes- 
mo símbolo”; mas que eles inicialmente não tinham descoberto (iii) “se a 
sequência começa com 3, não pode terminar com P”. 
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Para compreender o que acontece nessas simulações, faz-se crucial a 
distinção entre dado positivo e dado negativo (cf. $2.1, $2.5). Os partici- 
pantes só foram expostos a dados positivos. A lista em (11) não contém 
nenhum dado negativo (devidamente sinalizado como tal), nem instru- 
ções explícitas acerca das regras que determinam o formato das sequências 
admissíveis. Logo, a tarefa do participante que tentava desvendar o código 
não era das mais fáceis, porque suas fontes de informação eram pobres. Se- 
riam ricas se ele tivesse acesso a dados negativos e/ou a instruções explícitas 
sobre o sistema. Mesmo com essa pobreza de informação (que podemos 
chamar de pobreza de estímulo, já que (11) serviu de estímulo deflagrador 
de suas formações de hipóteses e eventual aprendizado, ainda que imper- 
feito), os participantes, tipicamente, são capazes de inferir as propriedades 
(i) e (ii) do código apenas com base nos dados positivos, construindo gene- 
ralizações/extrapolações a partir deles através de saltos indutivos simples. 
Contudo, é extremamente raro (mas não impossivel) que um participante 
infira a propriedade (iii) antes de ser informado explicitamente sobre os 
erros que havia na lista em (12) produzida pelos próprios participantes. 

Crucialmente, as explicitações quanto aos erros contidos em (12) cons- 
tituem dados negativos, que fazem toda a diferença no processo, levando 
os participantes a concluir a restrição (iii), que de outra forma era quase 
impossível de ser inferida a partir da amostra em (11). Algumas vezes em 
que apliquei esse experimento informal em sala de aula, elegi um estudan- 
te como especial, e dei-lhe previamente um bilhete contendo a seguinte 
informação: “no código que você está prestes a aprender, há um dado sím- 
bolo tal que, se uma sequência começa com ele, não pode terminar com 
ele”, Sistematicamente, durante a fase em que peço que os participantes me 
deem exemplos do que eles acham que sejam IDs válidas, a pessoa que leu 
o bilhete jamais me dá exemplos do tipo "BaBaBapoB. “Baba. *B. ou 
*Ba. Mais que isso, entre a formação da lista em (12) por seus colegas, e 
o momento da revelação dos erros e acertos, o participante que teve infor- 
mações privilegiadas se antecipa ao mediador e corrige seus colegas. Ou 
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seja, o que fez com que o participante especial não cometesse o mesmo erro 
de seus colegas foi a informação que ele tinha previamente à experiência. 
Diante de sequências começando e terminando com «, e da ausência de 
sequências começando e terminando com 3, o participante especial facil- 
mente conclui que f é o simbolo ao qual a mensagem do bilhete se referia. 
Os participantes sem acesso ao bilhete (única fonte para se inferir dados 
negativos) sistematicamente caem na armadilha, e seguem acreditando que 
todas as sequências em (12) seriam válidas até que sejam explicitamente 
informados de que não. 

Como dito acima, esse é o cenário típico, mas há casos de exceção, em 
que o participante sugere como potenciais sequências válidas exemplos 
como (a) *abyô, *aBydaBivô, (b) *abpa, *caBoa, *cabbca. Essas pes- 
soas certamente não internalizaram o padrão descrito em (i) e (ii) acima. 
Não surpreende que possa haver casos assim, dado que (11) contém apenas 
dados positivos e nenhuma instrução explícita sobre as regras. A rigor, o 
aprendiz não tem nenhuma evidência cabal de que padrões do tipo (a) ou 
(b) sejam impossíveis. Quem aposta em (a) toma como meramente aciden- 
talo fato de que, em (11), todas as sequências só trazem os símbolos « e 8; e 
explora outras possibilidades de alternância de símbolos do alfabeto grego. 
Quem aposta em (b) hipotetiza que, há alternâncias entre subsequências 
de «as e subsequências de /s, sendo acidental que, em (11), todas as sub- 
sequências tenham “comprimento 1º. Outras generalizações comparáveis a 
essas são possíveis, já que nenhuma delas é logicamente incompatível com 
a amostra em (11), exatamente pela total ausência de dados negativos e de 
instruções explícitas sobre as regras. 

Por que, então, é raro que se façam essas generalizações e é comum se fa- 
zer aquela baseada em (i) e (ii), que resulta na lista em (12)? E por que tam- 
bém é raro que alguém (sem ter lido o bilhete) infira a regra em (iii)? Essas 
são questões relevantes que não tenho como abordar aqui. Mas tangenciarei 
esses pontos adiante, a partir de dados gramaticais concretos. Por ora, basta 
reconhecer que, quanto mais numerosa for a amostra de exemplos em (11), 
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mais seguro se sentirá o aprendiz para fixar uma crença forte de que aquilo 
que não está representado ali seria de fato inválido de acordo com o código 
subjacente. Contudo, além de (a) e (b), haveria infinitas outras generaliza- 
ções logicamente possíveis, todas compatíveis com amostras de qualquer 
tamanho, E, particularmente nos casos de padrões gramaticais reais, ocorre 
que, mesmo diante de amostras gigantescas, há certas generalizações que as 
crianças nunca fazem, e outras que todas as crianças fazem, universalmente, 
sem que se possa apontar nenhum motivo para considerar que uma é mais 
complexa que outra, quer do ponto de vista estritamente formal, quer do 
ponto de vista da plausibilidade discursivo-pragmática diante do contexto 
efetivo. Tudo isso diz respeito à natureza geral ou específica dos vieses aprio- 
rísticos que as crianças exibem no processo de aquisição de uma gramática. 


855.4. HÁ COISAS VERDES NA SALA? OU TUDO É BRANCO? 


Nas próximas seções, veremos como os raciocínios abstratos elabora- 
dos nas seções anteriores se aplicam a casos concretos de internalização 
de padrões gramaticais por crianças, em situações típicas nas quais se dá 
a exposição às informações disponíveis (e sem exposição a informações 
indisponíveis). Esta é uma seção de transição em que situo a discussão a se- 
guir num contexto mais amplo acerca da controvérsia “inato ou adquirido” 
em linguagem. 

Diante do exposto em $5,3, assumamos que a cognição humana possui 
no mínimo algum viés apriorístico puramente formal que nos leva intuitiva- 
mente a fazer saltos de indução simples do tipo (8). Ao que tudo indica, isso 
seria uma capacidade geral da cognição, que independe do tipo de conteúdo 
sendo aprendido, portanto uma estratégia em princípio aplicável ao reco- 
nhecimento de padrões em diversos domínios do pensamento. Sendo assim, 
é natural supor que tais saltos também existam no aprendizado de gramática. 

Ilustro esse ponto com uma regularidade bem simples relacionada ao 
léxico e à morfofonologia. Os nomes de santos masculinos da religião 
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católica seguem o seguinte padrão: adiciona-se diante do nome próprio 
um “prefixo” cuja forma varia entre Santo e São, conforme o nome se ini- 
cie por vogal ou consoante, respectivamente (e.g. Santo Antônio, Santo 
Inácio, Santo Estêvão, São Francisco, São Pedro, São Benedito)". É fácil 
perceber que, após exposição a uma amostra significativa de nomes de 
santos, chega-se à regra relevante, através de um salto (ou dois) do tipo 
(8). Consequentemente, esse conhecimento pode ser aplicado a nomes 
novos. Por exemplo, não hesitamos quanto a qual forma do prefixo" usar 
quando — como expressão do nosso reconhecimento por suas virtu- 
des — dizemos metaforicamente que alguém merece ser elevado ao esta- 
tuto de um santo. Esparício certamente é Santo Esparício; e Zigrobaldo 
certamente é São Zigrobaldo. 

A questão que nos concerne particularmente é saber se Chomsky está 
certo quando afirma que já nascemos com algum viés adicional, cuja natu- 
reza é especificamente gramatical. Para avaliarmos essa proposta, é preciso 
examinar cuidadosamente os detalhes de sua lógica e os dados empíricos 
que são apresentados como evidência em seu favor. Há muitas críticas in- 
fundadas nesse sentido, ou pela incompreensão da lógica do argumento, 
ou pela desconsideração da base empírica relevante. Não raro, críticos 
apresentam como prova empírica da suposta refutação da tese inatista um 
conjunto de dados que nada tem a ver com os princípios gramaticais tidos 
como inatos. Ainda que a parcela inata das gramáticas particulares possa 
ser muito grande (ou muito pequena, essa é uma questão em aberto), nin- 
guém está propondo que tudo seja inato. Logo, não surpreende que haja 
nas línguas aspectos gramaticais idiossincráticos, cuja internalização por 
parte da criança se dê apenas com base na experiência com atos de fala 
concretos, aplicando-se a eles estratégias gerais de aprendizagem. O erro 
fatal é tomar qualquer desses outros fatos como evidência empírica contra 


18. Com nomes femininos, o 'prefixo' não varia, é sempre Santa (e.g. Santa Ifigênia, Santa 
Quitéria). 
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a tese do inatismo gramatical. No debate com Piaget, Chomsky (p. 137-138), 
em resposta a Inhelder (1980), teve de assertar o óbvio, tamanha era a in- 
compreensão que reinava: 


Permitam-me primeiramente estabelecer um ponto de lógica, sem ainda abor- 
dar as questões [centrais]. Suponham que eu afirme que algo nesta sala é verde, 
e que alguém responda: “Isso não é verdade, pois há algo aqui que é branco”. 
Isso jamais provaria que eu estaria errado ao dizer que algo nesta sala é verde. 
Analogamente, se eu afirmo que algumas propriedades da estrutura e do uso 
da linguagem já estão predeterminadas no estágio inicial [do organismo] por 
princípios especificamente linguísticos, ninguém prova que eu estou errado se 
me demonstrar que outros aspectos da estrutura e do uso da linguagem es- 
tão relacionados com outros aspectos do desenvolvimento cognitivo. Isto é um 
ponto elementar de lógica. 


Enfim, quando alegamos que os fatos A, B e C se seguem de conheci- 
mentos gramaticais inatos «x, e y, então qualquer tentativa de refutação 
deve levar em consideração esses mesmos fatos A, B e C (e não outros fatos 
K,W e Z), bem como a estrutura lógica do argumento que os conecta a 
q, À e Y; para só então demonstrar que «., À e y não seriam inatos, ou que 
outros princípios governariam A, B e C. Pode-se também demonstrar 
que os reais fatos seriam outros, distintos de A, B e C. Mas não se faz isso 
ignorando A, B e C de saída. 

Infelizmente, muitos não compreendem essa lógica elementar, o que 
torna preciso seguir assertando o óbvio até hoje. Fazendo isso, estamos 
sujeitos às acusações de (i) cometer o erro grave de assumir que só são 
relevantes para o tema do inatismo os fatos que os chomskyanos evocam; 
(ii) ter uma visão míope do panorama empírico e conceitual do objeto 
de estudo; e (iii) posicionarmo-nos de modo arrogante e prepotente, por 
descartar a priori contribuições vindas de fora. Sempre que me acusam de 
tais “heresias, respiro fundo e reafirmo a plenos pulmões que, sim, só são 
relevantes para o debate acerca da (in existência da GU os fatos que os ina- 
tistas alegam ser evidências a favor de conhecimentos gramaticais inatos, 
e demais fatos podem eventualmente ser relevantes, apenas na medida em 
que se mostrem relacionados aos fatos originalmente postos, e desde que se 
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apresente um argumento lógico que conecte os diferentes fatos. Onde está 
a suposta prepotência ou arrogância nisso? 

Em suma, o que nos concerne de perto são as “coisas verdes” da GU 
proposta por Chomsky. Elas existem ou não? O que elas seriam? Como 
vê-las? Ao investigarmos isso, estamos no nível da adequação explicativa 
(cf. $2.6), que pressupõe uma base sólida no nível imediatamente inferior 
da adequação descritiva. Afinal, para sabermos se o conhecimento X do 
falante é inato ou adquirido precisamos antes saber do que X é constituído: 
o exato conjunto de regras responsáveis pela (a)gramaticalidade dos dados, 
de modo compatível com o que se observa. Qualquer que seja a conclusão a 
que cheguemos no nível descritivo, ela define em grande parte as perguntas 
a serem respondidas nos níveis de adequação superiores: o explicativo, e os 
supraexplicativos. Enfim, a tese chomskyana de uma GU inata pressupõe 
que haja uma base empírica bem descrita a partir da qual as abstrações 
e as idealizações teóricas são construídas. É um erro crasso (infelizmen- 
te perpetuado por muitos) dizer que o inatismo seria um pressuposto da 
GGT. Isso é tão falso quanto uma moeda de sete dólares! O inatismo é 
uma conclusão à qual se chega a partir de fatos”. Cabe-nos discutir se tal 
conclusão é mesmo correta. Que fatos são esses? Quais conclusões menores 
são extraídas desses fatos, as quais, juntas, compõem a grande conclusão da 
existência de uma GU inata? 

Há uma série de fatos de diferentes tipos que subjazem à tese geral da 
existência de uma GU inata, que se compõe de uma série de argumentos, 
cada um oriundo de um desses conjuntos de fatos. Alguns desses argu- 
mentos são mais conclusivos, outros mais sugestivos; uns mais consensuais, 
outros mais controversos; uns mais conhecidos e estudados, outros mais 


19, propósito desse erro crasso, Bagno (2012: 48) passa dos limites da incompreensão inocente, Ele 
deliberadamente e sorrateiramente muda o nome do Argumento de Pobreza de Estímulo (APE) sem 
qualquer notificação, chamando-o de Axioma de Pobreza de Estímulo, como se essa fosse a terminolo- 
gia consagrada na GGT, induzindo o leitor ao erro de tomar o inatismo dos mecanismos da GU como 
premissa (ie, axiomático por definição), e não como condusão. 
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desconhecidos, etc. É impossível fazer justiça a tudo isso nos limites des- 
te capítulo. Portanto, nesse universo, seleciono o Argumento de Pobreza de 
Estímulo (APE) para ilustrar e defender a tese do inatismo gramatical, Essa 
escolha deve-se primeiramente ao fato de que esse argumento particular 
foi todo formulado pelo próprio Chomsky, já no início da década de 1960, 
e vem sendo lapidado por ele próprio e diversos pesquisadores”, Mais que 
isso, o APE é, dentre os argumentos pró-GU, o mais estudado, o mais de- 
fendido, o mais atacado, etc., sendo portanto o 'cartão de visitas” da tese 
da GU inata. Além disso, trata-se de um argumento com uma base lógica 
relativamente simples e com uma base empírica bastante robusta. No jar- 
gão da GGT, oscila-se entre falar de diversos APEs ou de apenas um APE. 
Na realidade, existe apenas um APE, e várias instâncias particulares desse 
mesmo APE, todas com a mesma estrutura lógica aplicada a fatos empíri- 
cos diferentes. Antes de discutir o APE de perto em $5.5, encerro esta seção 
mencionando brevemente outros argumentos pró-GU propostos no âm- 
bito da GGT, que o leitor pode estudar separadamente, em outras fontes. 
Um fato digno de nota e bastante difundido é a universalidade da uni- 
formidade que se observa nos estágios do processo de aquisição de lingua- 
gem. Excetuando-se casos de patologia congênita ou adquirida causadora 
de algum déficit cognitivo”, bem como situações extremas de privação da 
criança à exposição à linguagem (i.e. crianças enclausuradas por muito 
tempo, incomunicáveis), há uma uniformidade notável quanto a quais são 
os estágios do desenvolvimento gradual da competência gramatical, desde 
o balbucio até a formação e compreensão de sentenças complexas, passan- 
do por estágios intermediários em que a criança produz sentenças com 
graus de complexidade crescentes. Os pontos de início e término desses 


20. Embora a sua lógica básica já estivesse posta, foi em Chomsky (1975b, 1975d, 19804) 
que o argumento tomou a forma que tem hoje. Inclusive, a terminologia pobreza de estimu- 
lo foi introduzida em Chomsky (1980a: 34). 

21. Por exemplo, crianças com Sindrome de Down exibem um atraso significativo na aqui- 
sição de linguagem, bem como no desenvolvimento de outras habilidades cognitivas. 
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estágios também são majoritariamente uniformes, independentemente da 
língua em questão. Para apreciar descrições detalhadas dos fatos relevantes 
que infelizmente não cabem nesse capítulo, sugiro ao leitor que comece 
pelos manuais introdutórios de aquisição de linguagem de Crain & Lillo- 
-Martin (1999: 25-32) e de Grolla & Figueiredo-Silva (2014: 63-69), e depois 
consulte a bibliografia lá citada. 

Opositores à GU podem alegar que esse argumento é fraco, pois a uni- 
formidade não é a priori incompatível com a hipótese de um intellectus 
ipse de caráter geral, porém universal entre os membros da espécie por ser 
hereditário. Sob tal ótica, tais estágios apenas refletiriam a maturação da 
inteligência geral. Em tese, isso não deixa de ser uma possibilidade a ser 
explorada, mas para ser efetivamente corroborada é preciso detalhar os 
mecanismos que a inteligência geral teria, para que se façam previsões tes- 
táveis acerca dos estágios. Para haver consistência com a visão antimodular, 
os estágios no desenvolvimento da linguagem deveriam refletir de perto os 
estágios de desenvolvimento de outras habilidades cognitivas, o que não 
tem sido demonstrado. Além disso, a uniformidade é também observada 
diante de certos fatores que, sob uma perspectiva não inatista, deveriam 
interferir no resultado, como o ambiente ser bilíngue ou não, a criança ser 
ou não cega, ou surda, etc.” Alguns anti-inatistas defendem que um fator 
crucial para o desenvolvimento (em estágios de complexidade) da gramá- 
tica infantil seria o mãenhês, i.e. aquele jeito especial pelo qual adultos con- 
versam com crianças, por meio de sentenças aparentemente mais simples, 
em parte mimetizando a fala infantil, e com uma prosódia característica, 
além de uma linguagem corporal demonstradora de afeto”. No entanto, 


22. Quanto aos surdos, observa-se que os estágios na aquisição de linguas sinalizadas são os 
mesmos das faladas (cf. Crain & Lillo-Martin 1999: cap 28, 29, 30,31). 

23. Para uma breve descrição do mãenhês, cf. Grolla & Figueiredo-Silva (2014: 73-75). De- 
ve-se ressaltar que o estudo das idiossincrasias gramaticais do mãenhês enquanto registro 
de fala não é, por si só, pesquisa em aquisição da linguagem se nenhuma relação subs- 
tancial de causa e efeito tiver sido encontrada entre o mãenhês e o desenvolvimento da 
gramática da criança. 
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Brown & Hanlon (1970) e Gleitman et al. (1984) demonstraram que o tipo 
eo grau de atenção dado à criança pelos adultos não interfere nos estágios 
de desenvolvimento da gramática da criança, que só necessita de pessoas 
falando ao seu redor. Isso tem se confirmado em várias pesquisas desde en- 
tão. A propósito, uma série de pesquisas antropológicas e linguísticas mos- 
tram que o mãenhês não é uma prática universal. Existem culturas em que 
os adultos praticamente só se dirigem a crianças quando elas já falam (cf. 
Heath 1983; Schieffelin 1990; Pye 1992; Ochs 1998), não havendo registro 
de diferenças significativas quanto aos estágios de desenvolvimento da gra- 
mática nessas comunidades”, 

Outro argumento a favor de que o intellectus ipse contém módulos espe- 
cializados para determinadas tarefas, sendo a GU um deles, advém do fato 
de que existem fortes evidências da dissociação entre a competência gra- 
matical e outras habilidades cognitivas. De um lado, há pessoas portadoras 
de afasias, que são tipos de déficit especificamente relacionados à lingua- 
gem (comprometendo seriamente o funcionamento normal da gramática 
em diversos aspectos: lexical, morfológico, sintático, etc., a depender do 
tipo de afasia). Ser afásico não implica que as demais funções cognitivas 
também estejam comprometidas. Há muitos casos em que testes psicoló- 
gicos revelam que os pacientes têm percepção e concepção da realidade 
normais, embora fracassem sistematicamente na tarefa de se comunicar 
verbalmente. Dentre os vários pesquisadores dedicados ao assunto, Yosef 
Grodzinsky se destaca, pela quantidade e qualidade de suas obras, pelo fato 
de elas testarem explicitamente o paradigma chomskyano, em grande parte 


24. Pinker (1994; 40) alerta ainda para a existência de uma comunidade na África em cuja 
cultura predomina a forte crença de que crianças só aprendem a caminhar se forem trei- 
nadas pelos adultos, o que inclui um estágio intermediário em que elas têm parte de suas 
pernas enterradas no solo e permanecem por um tempo tentando manter ereto o tronco 
que naturalmente balança. Assim como nós sabemos que esse estágio intermediário de 
aprender a equilibrar o tronco é inútil para se dominar o caminhar, os habitantes das refe- 
ridas comunidades sabem que não é preciso sequer dirigir a fala às crianças para que elas 
venham a dominar a linguagem. 
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corroborando-o, e por elas serem produzidas no território interdisciplinar 
entre a teoria da gramática e as neurociências”. 

Do outro lado, há pessoas portadoras de certos tipos de déficit cognitivo 
que afetam negativamente, de muitas maneiras, a percepção e a concepção 
da realidade, bem como a interação social. Isso não necessariamente com- 
promete substancialmente a competência gramatical. Diversas investiga- 
ções sobre a linguagem de portadores da Síndrome de Williams revelam 
que, a despeito da grande dificuldade que os indivíduos têm para realizar 
tarefas que são triviais para pessoas sem déficit cognitivo algum, a compe- 
tência gramatical desses pacientes se apresenta praticamente intacta, apesar 
de haver desvios de desempenho esperados para portadores de tamanho 
déficit cognitivo geral. Para uma introdução ao tema da dissociação entre 
competência gramatical e cognição geral, recomendo a leitura de Guasti 
(2002: cap 11). A conclusão para a qual esses estudos apontam é que a gra- 
mática é processada no cérebro por sistemas neuronais e meios representa- 
cionais e computacionais próprios, não os mesmos responsáveis por outros 
aspectos da cognição. Isso reforça a tese pró-GU. 

Outra pesquisa muito relevante e influente em torno do tema encontra-se 
em Smith & Tsimpli (1995) e Smith et al. (2011), que investigaram em pro- 
fundidade um indivíduo de nome Christopher que é um raríssimo caso 
de savante cuja cognição geral é extremamente deficiente em muitíssimos 
aspectos, mas cuja competência gramatical é excepcionalmente superior à 
das pessoas normais. Devido à sua compreensão limitada da realidade, os 
discursos de Christopher são, sob a ótica da pragmática, simplórios e fazem 
pouco sentido. A estrutura gramatical de suas sentenças, no entanto, é per- 
feita. Mais que isso, Christopher tem uma capacidade singular para adquirir 
novas línguas com pouquíssima experiência, e numa velocidade bem acima 
da normal. Não se trata de um poliglota comum, mas de um caso-limite 
de dissociação entre competência gramatical e cognição geral. A inovação 


25. Cf. http://elsc.hujiac.il/grodzinsky/science/ publications 
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decisiva dessa pesquisa foi o fato de os pesquisadores terem criado a lín- 
gua artifical Epun, com várias características gramaticais comuns a diversas 
línguas do mundo, exceto por um detalhe que, de acordo com a proposta 
chomskyana de GU, seria impossível de existir numa língua humana, por 
violar um princípio essencial do cerne da GU: o princípio de dependência 
de estrutura, segundo o qual transformações não podem ser definidas em 
termos da ordem linear dos elementos envolvidos, apenas das suas posi- 
ções hierárquicas na estrutura sintagmática (cf. Chomsky 1975b: 32-33, inter 
alia). Christopher foi capaz de aprender Epun com facilidade, exceto uma 
regra muito simples que determinava que o IL nog, marcador de ênfase, 
deve ser inserido logo após o terceiro elemento terminal da sequência. 

Isso nos remete a outra linha de investigação de onde proveem mais ar- 
gumentos pró-GU. Inspirados em Smith & Tsimpli (1995), outros pesqui- 
sadores têm conduzido experimentos de ensino e aprendizagem de línguas 
artificiais com características que correspondem aos princípios hipoteti- 
zados como inerentes à GU, ou com características que os violam fron- 
talmente. Dentre essas pesquisas, destaca-se o trabalho de Moro (2008), 
que demonstra que os fragmentos de gramática inventados aprendíveis e 
os “inaprendíveis” correspondem grosso modo ao que a teoria da GU prevê 
como possível ou impossível. 

As chamadas línguas pidgin e crioulas também são fonte de evidência 
empírica para a tese da GU inata. Grosso modo, um pidgin não é uma língua 
genuína, mas um código de comunicação verbal que emerge em situações 
atípicas em que populações falantes de línguas bem distintas se encontram, 
e as pessoas se comunicam “do jeito que dá” com fragmentos da gramática 
e do léxico de ambas as origens. Isso ocorre, por exemplo, em contextos de 
colonização e escravidão, certos tipos de migração, zonas de fronteira, etc. 
Pidgins são fragmentos de gramática e léxico, sem o mesmo grau de com- 
plexidade e poder expressivo das línguas ordinárias, mas cumprem razoa- 
velmente sua função de comunicação imediata de mensagens básicas. Não 
raro, certos pidgins se consolidam numa dada região como língua franca 
falada por um grupo de pessoas que se estabeleceram ali. 
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Interessantemente, os filhos dessas pessoas, que nasceram e cresceram 
escutando aquele pidgin, acabam não falando aquela língua defectiva. 
Eles interpretam aquilo que escutam como fragmentos de uma gramá- 
tica completa, tão complexa e expressiva quanto qualquer outra, mesmo 
sem terem escutado nenhuma amostra do “resto” da lingua. As crianças 
simplesmente inventam as partes que faltam, preenchendo os vazios dei- 
xados pela experiência escassa. E elas o fazem de tal modo que as es- 
truturas que emergem reproduzem em boa parte padrões que a teoria 
chomskyana da GU prevê como inerentes a F,. Algumas generalizações 
empíricas significativas nessa direção levaram Bickerton (1984) a aca- 
tar a tese chomskyana e declarar que há um bioprograma no intellectus 
ipse de toda criança, direcionando-a a certos padrões gramaticais. Entre 
muitos fenômenos notáveis, destaco a fortíssima tendência de os crioulos 
terem sujeito'verbo"objeto (SVO) como ordem canônica. Entre os não 
crioulos, essa ordem é tão comum quanto sujeito“objeto'verbo (SOV), 
por exemplo. Segundo Bickerton, em consonância com certos autores da 
GGT, o bioprograma (i.e. a GU) seria, metaforicamente falando, como 
uma máquina que vem de fábrica com certas configurações default, que 
podem ou não ser modificadas. Para ele, a ordem SVO seria um desses 
padrões default. O mais interessante é que existem crioulos com ordem 
SVO a despeito de as línguas que o originaram fossem SOV (cf. Roberts 
1999: 307-309). Ou seja, a criança pode até escutar a ordem SOV com 
frequência, mas não “bota fé” nela, em razão das deficiências gramaticais 
ali presentes quanto à morfologia, prosódia, etc., e reinterpreta aquilo 


26. Isso não significa que uma ordem seria melhor ou mais natural ou funcional que a 
outra; mas apenas que uma delas é 'a que vem de fábrica), como um toca-discos vem de 
fábrica regulado para girar na velocidade 33º rpm, mas a velocidade 45 rpm é igualmente 
“nativa e natural ao equipamento. Esse caráter default da ordem SVO (já mencionado em 
$4.4.2,n.34) é, para alguns autores (e.g. Kayne 1994; Biberauer, Holmberg & Roberts 2014), 
fruto de um princípio ainda mais forte da GU segundo o qual toda gramática é SVO na 
base, sendo todas as outras ordens (inclusive SOV, que é tão comum) derivadas via alguma 
combinação de movimentos. 
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como versões imperfeitas de um padrão SVO subjacente”. Qualquer se- 
melhança com a concepção de Descartes sobre o triângulo ideal não é 
mera coincidência. 

Mais um argumento a favor da tese da GU inata advém de um avanço 
recente no âmbito da ciência genética, e que foi noticiado na imprensa de 
modo sensacionalista como “a descoberta do gene da linguagem”, o que, 
mais que um exagero, é um erro. Entretanto, os fatos apontam, sim, para 
a existência de estruturas do cérebro especializadas para a linguagem (cf. 
Boeckx 2010: 174-179, para uma introdução, e Piattelli-Palmarini & Uriage- 
reka 2005, 2011, para uma elaboração). Primeiramente, a linguista Gopnik 
(1990) relatou em seu estudo a existência de uma família no Reino Uni- 
do (conhecida como “família KE”) na qual metade de seus membros, por 
quatro gerações, eram portadores de uma afasia severa de um tipo bem 
singular (não relacionada a outro déficit cognitivo e manifesta em aspectos 
gramaticais pontuais, como a omissão sistemática de morfemas de flexão 
verbal, o uso redundante de pronomes quando não necessário, etc.). 

Adiante, Fisher et al. (1998), numa pesquisa que integrava o Projeto 
Genoma Humano (cf. www.genome.gov), descobriram que, no DNA dos 
membros afásicos da família KE, havia uma anomalia num fragmento do 
cromossomo 7, composto de centenas de genes (cf. https://ghr.nlm.nih.gov/ 
chromosome/7). Em qual deles estaria o problema? Num golpe de sorte, os 
geneticistas descobriram, em um garoto sem parentesco com a família KE, 
uma afasia do mesmo tipo, e o cromossomo 7 desse garoto exibia uma ano- 
malia estrutural no mesmo lugar em que ela foi detectada nos membros da 


27. Acima mencionei a universalidade e uniformidade quanto aos estágios do processo de 
aquisição de linguagem comparando-se crianças cegas ou surdas com aquelas sem limi- 
tações de percepção. Com crianças surdas filhas de pais não surdos, ocorre um fenômeno 
correlato à formação de crioulos, e que reforça a tese da GU inata. Tais crianças, mesmo 
sem estímulo algum de língua de sinais, acabam criando seus próprios sistemas de gestos a 
partir dos gestos não linguísticos que os falantes produzem enquanto falam. Tais sistemas 
têm muito em comum com as línguas de sinais efetivamente faladas por populações de 
surdos (cf. Goldin-Meadow 2014). 
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família KE. Esse ponto específico de anomalia foi nomeado gene FOXP2. 
O erro da notícia sensacionalista está na pressuposição de que haveria um 
único gene que codificaria toda a linguagem (e mais nada). Sabe-se que o 
FOXP?2 está envolvido em outras coisas além da linguagem, bem como que 
ele está presente nos mamíferos em geral. Sabe-se também que se trata de 
um gene bastante conservado na linhagem evolutiva, tendo sofrido apenas 
três mutações (entre 715 possíveis) desde ancestrais mais remotos até nós. 
Crucialmente, uma dessas mutações teria ocorrido no ponto de mutação 
em que se diferenciaram os chimpanzés e os humanos, o que pode estar por 
trás do salto de complexidade entre a nossa comunicação e a dos demais 
primatas. Ainda não se conhece o exato papel do FOXP2 na linguagem hu- 
mana, mas os indícios apontam fortemente para uma conexão entre esse 
gene e a predisposição do cérebro humano para a gramática. 


85.5. O PROBLEMA DE POBREZA DE ESTÍMULO & O ARGUMENTO 
DE POBREZA DE ESTÍMULO 


Considere uma criança C em processo de internalização de uma dada 
gramática G. Tomemos uma dada regra R de G. Mesmo restringindo nosso 
escopo investigativo a uma única regra de uma única gramática por uma 
única criança, uma teia de questões importantes já se coloca imediatamen- 
te, e delas emergem questões mais gerais sobre toda e qualquer regra de 
toda e qualquer gramática sendo internalizada por toda e qualquer criança. 
Supondo que a regra R é de algum modo aprendida por C, como se dá esse 
aprendizado? Que tipo de aparato cognitivo já presente na mente de C foi 
utilizado para que € passe a conhecer R? Que tipo específico de experiência 
(i.e. enunciados de sentenças, encaixados em discursos e situações) serve 
como evidência deflagradora para que C infira a existência de R a partir da 
sua experiência E com dados linguísticos em atos de fala concretos? 

Qualquer que seja o quadro teórico do pesquisador, o enfrentamento 
dessas perguntas é inexorável para que se atinja o nível de adequação 
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explicativa. Logo, é preciso, entre outras coisas, trabalhar a partir de fatos 
concretos sistematicamente observados e bem descritos. Caso contrário, 
estaríamos fazendo como fez Jean Piaget, discutindo as grandes questões 
in abstracto, sem meios efetivos de averiguar se os mecanismos cognitivos 
propostos como propriedades de F, (sejam eles gerais ou especificamente 
gramaticais) são de fato aquilo que compõe o aparato cognitivo huma- 
no, atuando na aquisição de linguagem”. Inversamente, de nada adianta 
apenas colecionarmos observações sobre o comportamento linguístico 
das crianças e dos adultos, comparando-se as semelhanças e diferenças. É 
preciso analisar os fatos à luz de uma lógica consistente. O problema a ser 
resolvido tem, portanto, aspectos empíricos e conceituais. Em brevíssimo 
ficará claro o porquê de ele ser rotulado como o Problema de Pobreza 
de Estímulo (PPE). Comecemos por sua anatomia lógica, que já aponta 
para uma direção de solução, que, no entanto, só pode ser devidamente 
validada diante do exame atento dos fatos empíricos que discuto adiante, 
os quais, por sinal, também são cruciais para se validarem as premissas 
nas quais toda a lógica se sustenta. Para efeitos de discussão, tomemos as 
quatro afirmações em (13) como premissas verdadeiras: 


(13a) Dados positivos e negativos acessíveis ao linguista mostram que R é ope- 
rante em G; 

(13b) Aprender R via experiência requer acesso a dados negativos do tipo Ds” 

(13c) € não tem acesso a D *; 

(13d) C exibe o conhecimento de R desde os primeiríssimos estágios de aquisição. 


Na prática, a veracidade dessas afirmações vai depender de seus con- 
teúdos específicos (e.g. De qual R estamos falando? De qual D,* estamos 
falando? etc.). Se qualquer dessas premissas for demonstrada falsa, isso 


28. Analogamente, não se pode teorizar sobre seleção natural em termos vagos, sem especi- 
ficar quais traços estariam sendo selecionados nem o ambiente em que tal seleção se daria. 


29. Afirma-se aqui que o acesso a certos dados negativos é condição necessária, não que 
seja condição suficiente. 
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invalida todo o raciocínio subsequente, Argumento a seguir que o ônus da 
prova recai majoritariamente sobre quem nega tais premissas, não sobre 
quem as assume. Por ora, apreciemos a estrutura puramente lógica das 
afirmações em (13). Se todas forem verdadeiras, (14) se segue como con- 
clusão inescapável. 


(14) Ctem o conhecimento inato de R (portanto, a rigor, não aprendeu essa parte 
RdeG). 


(13a) se situa no nível da adequação descritiva. Se nosso aparato teóri- 
co-analítico faz previsões acuradas quanto aos dados positivos e negativos 
relevantes (i.e. não sobregera nem subgera dados), há forte evidência de 
que R seja de fato a regra responsável pelos fatos. Para demonstrar que 
(13a) seria falsa, devem-se detectar dados positivos logicamente incom- 
patíveis com R, e/ou dados negativos compatíveis com R (desde que se 
demonstre que eles não violam nenhuma outra regra do sistema), caso em 
que a conclusão em (14) seria colocada em xeque no que concerne a R. 
Além disso, nada impede que se proponha uma teoria alternativa melhor, 
na qual a regra relevante é K, bem mais simples que R, e com a vantagem 
de ter uma cobertura empírica ainda maior, abrangendo outros fenôme- 
nos. Na ausência de uma análise alternativa descritivamente adequada, só 
resta a qualquer pesquisador racional assumir (13a) como premissa, até 
evidência em contrário. 

A premissa (13b) diz que certos tipos específicos de dado negativo seriam 
cruciais para aprender R. Isso faz sentido nos casos em que R é uma regra 


proibitiva, uma restrição que limita a capacidade gerativa de outras regras 
de G, fazendo com que certas estruturas, que na ausência de R seriam gra- 
maticais, sejam agramaticais. Como vimos em $2.5, dados positivos (muitos 
tipos são abundantes em E, alguns são escassos) são exemplos claros do que 
é possível conforme G. Dados negativos, ausentes em E, seriam enunciados 


de estruturas agramaticais sinalizadas como tais, exemplificando o que é 
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impossível conforme G. No caso de R ser uma regra proibitiva, dados nega- 
tivos são cruciais (retomo esse ponto adiante). 

A verdade de (13c) é autoevidente. Negar isso implica enfrentar o ônus 
da prova de demonstrar que C recebe informação suficiente para inferir 
a existência de R a partir de dados negativos que lhe seriam apresentados 
como exemplos do que é agramatical em virtude de ser proibido por R, 
o que implica que E contém enunciados de dados agramaticais (profe- 
ridos quer pelo próprio adulto ao instruir a criança, quer pela criança 
cometendo um erro característico de quem ainda não dominaria R) in 
tandem com a explicitação, por parte do adulto interlocutor, de que tais 
enunciados são agramaticais. 

Ninguém nega que, ocasionalmente ou frequentemente (a depender do 
ambiente social que circunda a criança), há adultos corrigindo a fala de 
crianças (e.g. “Tá errado dizer Eu vi ela; o certo é dizer Eu a vi”). Porém, 
deve-se ter em mente os seguintes fatores. Tais correções são voltadas para 
um subconjunto pequeno dos fenômenos gramaticais dos quais os adultos 
têm consciência metalinguística. Em muitos casos, trata-se de questões re- 
lativas à norma padrão em oposição à coloquial. Em outros tantos, trata-se, 
de fato, de uma 'censura' a desvios típicos da fala infantil em relação à fala 
adulta (e.g. O sapato cabeu no meu pé versus O sapato coube no meu pé). 
Há também 'censura” a palavrões (e.g. do caralho versus excelente) ou a 
ILs inapropriados a um contexto mais formal (e.g. a senhora versus você). 
Esses últimos casos, claramente, nada tém a ver com a gramática em si, 
apenas com a etiqueta do uso da linguagem. Quanto aos demais, é preciso 
notar primeiramente que os aspectos gramaticais ressaltados são distintos 
daqueles relevantes para a discussão sobre o caráter inato ou não de prin- 
cípios restritivos da GU (ilhas, lacunas parasitas, princípios de ligação, mi- 
nimalidade relativizada, etc.). Outro fato importante a ser ressaltado é que 
muitíssimas das “intervenções corretivas” dos adultos são ambíguas quanto 
ao que está sendo corrigido: se a estrutura gramatical do enunciado, ou a 
sua inadequação pragmática, ou até mesmo a ação executada pela criança e 
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não o que ela disse sobre aquilo. Inversamente, o adulto pode dar um claro 
sinal de aprovação (e.g. “muito bem, filhota, é assim que se fala!”) quando 
a criança produz um enunciado gramaticalmente anômalo, mas cujo con- 
teúdo é pragmaticamente adequado. Além disso, muitos estudos registram 
que crianças tendem a não prestar atenção nas correções dos adultos, ou 
não compreendê-las”. 

Quanto a (13d), primeiramente é preciso reconhecer que a fala infantil 
tipicamente exibe desvios em relação à linguagem adulta (e.g. O sapato 
cabeu no meu pé). Sempre que flagramos algo assim, identificamos algum 
aspecto da gramática adulta que a criança ainda não internalizou devida- 
mente. Mas haveria tipos de desvio que nenhuma criança comete? É isso 
o que se espera se a tese da GU estiver correta, pois a criança já nasceria 
sabendo certas regras (e.g. R, R, R,.. R,). Isso é verificado não apenas 
pela fortemente sugestiva (mas não totalmente conclusiva) ausência, em 
corpora de fala infantil, de enunciados contendo estruturas incompatíveis 
com R (afinal, ausência de evidência não é evidência de ausência). A me- 
todologia da GGT nos estudos no nível de adequação explicativa há muito 
tempo inclui técnicas experimentais em que crianças são inseridas num 
contexto lúdico muito bem controlado pelo experimentador, tal que ela, 
sem perceber que sua linguagem está sendo investigada, acaba sendo pro- 
vocada a reagir verbalmente a certos estímulos da brincadeira. Entre os 
estudos pioneiros nessa área, destacam-se o de Berko (1958), anterior à 
ascensão da GGT, e o de Crain & Nakayama (1987), no auge do modelo da 
TRL. De lá para cá, muito se avançou nesse sentido, e técnicas mais sofis- 
ticadas foram desenvolvidas para que as reações infantis provocadas pelo 
experimentador (sejam elas enunciados da criança ou ações indicativas de 
como ela interpretou a fala dos participantes da brincadeira) acabem nos 
revelando a intuição da criança sobre o que, de acordo com a gramática 


30. Para exemplos concretos dos pontos levantados nesse parágrafo, remeto o leitor a Pin- 
ker (1989: cap 1; 1994: 280-283), Uriagereka (1998: 6-7), Crain & Thornton (1998: 20-22), 
Grolla & Figueiredo Silva (2014: 44-47). 
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dela no estágio em que ela se encontra, seria uma estrutura impossível. 
Enfim, com a devida técnica, é possível extrair juízos de aceitabilidade ro- 
bustos de crianças, e descobrir o que para elas é dado negativo. Uma dessas 
técnicas é a Tarefa de Juízo de Valor de Verdade (cf. Crain & McKee 1985, et 
seq.), explicada adiante. Para uma visão panorâmica do tema, cf. Crain & 
Thornton (1998), Crain & Lillo-Martin (1999) e Grolla & Figueiredo-Silva 
(2014: 93-162). Entre outros pesquisadores influentes nessa área, destaco 
Lila Gleitman, Thomas Roeper e Jeffrey Lidz. Juntos, todos esses estudos 
corroboram fortemente a veracidade da premissa em (13d). 

Feitas essas considerações teórico-metodológicas, vamos aos fatos. Ini- 
cio por dados já vistos em $2.5, repetidos em (15) e (16). 


(15a) Léo alertou você [que Zé espionava Cris). 
(15b) Quem, (que) Léo alertou você [que Zé espionava O J? 
(16a) Léo alertou você [enquanto Zé espionava Cris). 


(16b)  *Quem, (que) Léo alertou você [enquanto Zé espionava O)? 


Desses quatro dados, apenas (16b) é negativo, portanto não presente na 
experiência E da criança-aprendiz. O motivo dessa agramaticalidade há de 
ser consequência de alguma regra. Independentemente de quais forem os 
detalhes finos da regra proibitiva real, pode-se caracterizá-la em termos 
gerais como a impossibilidade de um sintagma-QU gerado no âmbito de 
uma oração subordinada não complemento se mover para além dos li- 
mites daquela subordinada”. É crucial que a definição da “prisão” da qual 
o sintagma-QU não pode sair especifique o caráter não complemento da 
oração subordinada, caso contrário (15b) também seria dado negativo, 
mas é positivo. Se a criança tem acesso a (15a) e (15b), ela poderia extrair 
de E a generalização falsa de que, em perguntas, sintagmas-QU são moví- 


31. Alternativamente, pode-se dizer que um sintagma-QU fronteado não pode ter o mes- 
mo índice referencial de uma lacuna que ocupa uma posição sintática dentro de uma ora- 
ção subordinada não complemento. 
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veis de dentro de qualquer oração subordinada, podendo ser fronteados à 
oração principal. 

Porém, uma vez feita essa generalização, a consequência lógica natural 
seria tomar (16b) como possível por analogia a (16a) e ao par (15a)-(15b), 
já que em (16b) também há o fronteamento de um sintagma-QU gerado 
numa oração subordinada. A agramaticalidade de (16b) deve-se à regra 
proibitiva que limita o poder gerativo da regra de movimento. Mas essa 
regra proibitiva não tem como ser inferida da experiência, pois a criança 
não tem acesso a dados negativos como (16b), devidamente classificados 
como tais. Sem essa informação, o natural é tomar (15b) e (16b) como 
dados análogos, ambos envolvendo fronteamento de um sintagma-QU ge- 
rado numa oração subordinada. A distinção entre (15b) e (16b) é real e 
facilmente detectável por um linguista perspicaz que fabrica dados novos e 
os submete ao julgamento do falante nativo para saber se eles são positivos 
ou negativos. É assim que o cientista deduz a existência da regra proibitiva. 

Mas como a criança chega à mesma conclusão sem acesso a (16b)? Ten- 
do em mente o que vimos em $5.3 sobre indução, a extrapolação mais sim- 
ples e natural a se fazer a partir de (16a) e do par (15a)-(15b) é inferir que 
(16b) também é gramatical por ser do mesmo tipo de (15b). Note que a 
regra proibitiva em questão tem aquele formato “exceto se..” que demons- 
trei em $5.3 ser um obstáculo insuperável para o aprendiz, porque, a rigor, 
poderia haver infinitas restrições em potencial, e o aprendiz não teria de 
onde tirar informação que o guiasse na direção daquela proibição específi- 
ca, em vez de outras como (i) “O fronteamento do sintagma-QU é permi- 
tido, exceto se ele for sujeito de um verbo trissilábico oxitono iniciado por 
uma fricativa, e cujo objeto direto é uma oração subordinada”, ou (ii) “O 
fronteamento do sintagma-QU é permitido, exceto se ele for objeto direto 
de um verbo de conjugação irregular cujo sujeito é formado por coordena- 
ção de cinco NPs, todos nucleados por nomes femininos”, etc. 

Do ponto de vista de um aprendiz não enviesado a priori por uma GU, 
as restrições em (i) e (ii) acima são tão naturais ou tão estranhas quanto a 
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restrição de ilha efetivamente presente na gramática. Se o aprendizado de 
gramática passasse pelo mesmo filtro da cognição geral que evita invencio- 
nices do tipo “exceto se..” a menos que haja evidência empírica para tal, 
esperaríamos que as crianças não inferissem nenhuma dessas restrições, 
nem mesmo a restrição de ilha de oração subordinada adjunto, porque 
não há evidência empírica disponível para que se infira tal regra. Dados 
negativos do tipo (16b) não fazem parte de E. Isso faria com que crianças 
tomassem (16b) como gramatical e do mesmo tipo de (15b), não levando 
em conta o fator de a oração subordinada ser complemento ou não. Con- 
sequentemente, tais crianças acabariam falando uma língua sem restrição 
de ilha quando se tornassem adultas. Mais que isso, espera-se que nenhuma 
língua tenha tal restrição em sua gramática. Porém, o que se observa é não 
somente a universalidade do comportamento verbal infantil em relação à 
não enunciação de dados do tipo (16b), como também a universalidade 
dessa restrição de ilha nas diversas línguas do mundo. É exatamente isso 
que a tese da GU inata prevê. 

Mas por que a criança não poderia ser perspicaz e prestar atenção nisso? 
Em princípio, uma dada criança C até poderia sim, se sua percepção for 
muito aguçada e se ela, por alguma razão, ignorar os infinitos outros fatores 
para se focar nesse. A questão é por que todas as crianças prestam atenção 
exatamente nisso, extrapolam a partir dos dados positivos do modo como 
fazem e não de outros, igualmente compatíveis com a experiência E? 

O fato de E ser compatível com infinitas gramáticas imagináveis, pela 
ausência de dados negativos do tipo relevante, legitima dizermos que o es- 
tímulo é pobre. Temos então o Problema de Pobreza de Estímulo. A lógica 
e a evidência empírica nos levam à conclusão de que a solução para esse 
problema é neoplatônica: i.e. a regra R (nesse caso, a restrição de ilha 
adjunto) é um conhecimento apriorístico da GU inata (e também as no- 
ções de adjunção, movimento, etc.). O raciocínio que nos conduz das pre- 
missas em (13) — sustentadas empiricamente — até a conclusão em (14) é o 
que chamamos de Argumento de Pobreza de Estímulo (APE). O que acabo 
de mostrar é uma instância particular do APE entre muitas. 
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O diagrama de Venn abaixo é tradicionalmente usado por chomskyanos 
para sintetizar a essência do APE. Os símbolos '+ e'— representam instân- 
cias diversas de dados positivos e negativos, respectivamente, em relação 
ao fato em pauta (no caso: restrição de ilha adjunto). A figura oval menor 
(=Y) é o conjunto de dados semelhantes a (15a), (15b) e (16a). A figura 
oval maior (=Z) é o conjunto que contém todos os dados contidos em Y e 
também contém dados semelhantes a (16b). Claramente, Y é um subcon- 
junto próprio de Z. 


am 


yT Z 


Em sua experiência, a criança escuta apenas dados restritos a Y. No 
entanto, isso não indica para ela que a gramática que subjaz aos dados 
escutados gera apenas aqueles em Y. Ao contrário, os dados escutados, por 
si próprios, sugerem que a gramática que os gerou também gere vários da- 
dos contidos em Z (e.g. (16b)) análogos a dados em Y (e.g. (15b)). Assim, 
para uma criança que não nascesse enviesada em favor de Y, o mais natural 
seria assumir que a gramática abrange todos os dados em Z, já que a res- 
trição da gramática a Y requer o conhecimento de uma cláusula do tipo 
“exceto se...” que não pode ser inferida apenas da experiência e de meios 
gerais de generalização por indução. 

Vejamos agora mais uma instância do APE”, Em $3.7, abordei simpli- 
ficadamente um pouco da Teoria de Ligação. Retomo aqui os dados que 
usei para ilustrar o Princípio C, que regula a referência de DPs não dêiticos. 


32. Dada a escassez de espaço, limito-me a ilustrar a estrutura geral do APE com esses dois 
fenômenos sintáticos. A literatura técnica está repleta de outros fatos que embasam instân- 
cias do APE, inclusive aqueles do âmbito fonologia (cf. Idsardi 2005) e da morfologia 
(cf. Bobaljik 2012). 
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(18a) Alice disse que ela bebeu chá. (18b) Ela disse que Alice bebeu chá. 
(18c) Alice disse que Alice bebeu chá. (18d) [A amiga dfela)) disse que Alice 
bebeu chá. 


No plano da adequação observacional, os fatos relevantes são: (i) em (18a) 
e (18d), Alice e ela podem ser correferentes, embora não necessitem ser 
(isso depende do contexto discursivo); (ii) em (18b) Alice e ela não podem 
ser correferentes, a despeito de qualquer contexto discursivo favorável a tal 
interpretação; e (iii) em (18c), as duas instâncias de Alice não podem ser 
correferentes, independentemente do contexto (i.e. temos duas mulheres 
distintas com o mesmo nome). No plano da adequação descritiva - como 
vimos em $3.7 — a regra que captura esses padrões pode ser simplificada- 
mente definida como se segue: um DP não dêitico não pode compartilhar 
seu índice referencial com nenhum DP que o c-comande. 

Os linguistas sabem disso porque, além de todo o trabalho intelectual 
de formulação e testagem de hipóteses, tiveram acesso a dados negativos 
(obtidos através da intuição dos falantes para dados hipotéticos fabricados 
por pesquisadores). Nesse caso, os dados negativos seriam versões de (18b) 
e (18c), com as mesmas sequências terminais, porém com coindexação en- 
tre Alice e ela em (18b), e entre Alice e Alice em (18c). Como uma criança 
pode chegar a tal conclusão sem acesso a esses dados negativos? Como não 
deixar de fazer uma analogia entre (18a) e (18b), supondo que, se a cor- 
referência é possível em (18a), também o seria em (18b)? Note que (18d) 
é evidência positiva contra qualquer hipótese de que a ordem entre o DP 
pronominale o DP não pronominal poderia ser a razão da impossibilidade 
de correferência em (18b), pois (18d) traz a mesma ordem com correferên- 
cia possível. De onde a criança conclui que as duas instâncias de Alice não 
podem ser correferentes em (18c)? Aliás, num dado positivo como A amiga 
de Alice disse que Alice bebeu chá — estruturalmente análogo a (18d) — a 
correferência é possível, o que tornaria praticamente irresistível assumir 
que o mesmo valha para (18c). 

Aplicando a lógica geral do APE aos dados em (18), chega-se à conclu- 
são de que o Princípio C é inato (e, consequentemente, também a noção de 
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c-comando, as distinções entre os tipos de DP, índice referencial, etc.). Essa 
tese é corroborada por pelo menos dois fatos robustos. Primeiramente, as 
pesquisas tipológicas feitas no âmbito da GGT revelam que as mesmas ge- 
neralizações extraídas dos dados em (18) valem para todas as línguas es- 
tudadas. Em segundo lugar, experimentos de investigação da fala infantil 
revelam que as crianças têm conhecimento do Princípio C desde o iní- 
cio, não sendo possível flagrá-las interpretando dados como (18) de modo 
contrário à regra. Descrevo agora, de modo superadaptado e simplificado, 
as linhas gerais de um experimento de Stephen Crain (e colaboradores), 
replicado com crianças adquirindo diversas línguas, sempre com os mes- 
mos resultados (usando a técnica da Tarefa de Juízo de Valor de Verdade). 
Digamos que as sentenças em (18) sejam apresentadas para a criança logo 
após ela ter assistido a um teatrinho de bonecos, no qual (a) a personagem 
Alice bebeu chá; (b) havia apenas uma outra personagem feminina, a qual 
não disse que Alice bebeu chá; e (c) Alice disse ter bebido chá. Ao final do 
teatrinho, a criança interage com um fantoche que diz saber de tudo o que 
ocorreu na historinha. A tarefa da criança é julgar se aquilo que o fanto- 
che diz é verdadeiro ou falso. Dado o contexto, (18b) seria um enunciado 
verdadeiro caso o Princípio C não estivesse sendo aplicado. As crianças, no 
entanto, facilmente detectam que o fantoche não falou a verdade quando 
proferiu (18b). Isso revela que o Princípio C já está internalizado desde 
muito cedo. Para detalhes sobre experimentos reais aos quais fiz alusão, cf. 
Crain & Thornton (1998: 209-270), Crain & Lillo-Martin (1999: cap 14, 15), 
e Grolla & Figueiredo-Silva (2014: 127-162). 


855.6. REFUTANDO OBJEÇÕES AO ARGUMENTO DE POBREZA DE 
ESTÍMULO, REFORÇANDO-O 


Embora a sua lógica seja tão cristalina e sua sustentação empírica tão 
robusta, o APE tem sido muito incompreendido desde a década de 1960 
até hoje. Seria preciso um livro inteiro para comentar todas as originalís- 
simas acusações de que o APE seria circular ou se assentaria em falácias. 
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Considero isso desnecessário dado o exposto em $5.5*. Faço questão, po- 
rém, de refutar as objeções clássicas, que têm sido postas repetidamente 
por autores distintos com uma retórica que alega originalidade de uma 
ideia velha e já refutada. 

Uma objeção frequente ao APE se resume à acusação rasa de que ele 
seria um “apelo à ignorância” (tal qual o deus das lacunas dos apologetas). 
Diz-se que a conclusão do inatismo no APE seria uma fuga para não ter que 
admitir que não se conseguiu solucionar o PPE (cf. Everett 2013). Ou seja, 
ao se perguntarem como (por que meios cognitivos, observando que fatos) 
a criança C internaliza uma regra R da gramática, e, fracassando na tenta- 
tiva de resposta, os inatistas abandonariam a empreitada prematuramente 
sem considerar outras possibilidades e declarariam que o PPE não é um 
real problema relativo a aquisição porque, a rigor, R não fora aprendida, 
assumindo como premissa que a criança nasceu sabendo R. Muitos críti- 
cos, por incompreenderem a lógica do argumento que tem o inatismo não 
como premissa, mas como conclusão, e por ignorarem solenemente a com- 
plexidade dos fatos empíricos, declaram que a tese da GU inata não seria 
testável, logo não satisfaria ao critério popperiano de refutabilidade, sendo 
assim pseudocientífica (e.g. Evans 2014a: 14). Dizem eles que Chomsky não 
provou que uma GU inata é o real motivo pelo qual a criança exibe desde 
o início um comportamento verbal compatível com o conhecimento dos 
mecanismos gramaticais relevantes (e.g. restrição de ilha, minimalidade 
relativizada, princípios A, B e C, etc.). Afinal, não há como se ter certeza 
de que a explicação para todos os aspectos do PPE não possa residir em 
mecanismos da cognição geral ainda por serem decobertos, e que, uma vez 
compreendidos, possam vir a explicar os fatos gramaticais melhor do que 
a tese da GU inata, através de um modelo muito mais simples e unificador. 

Uma primeira resposta a essas críticas, repetidas até hoje, já fora dada 
por Chomsky no famoso debate com Piaget. Mais especificamente, na 


33. A esse respeito, cf. Chomsky (1980€), Fodor (1980b), Laurence & Margolis (2001) e 
Guimarães (2007). 
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discussão que se seguiu à apresentação de Cellérier (1980), Chomsky 
(p. 80) afirmou o seguinte: 


Hipóteses inatistas são refutáveis em princípio, Qualquer hipótese que diga que 
uma dada propriedade da linguagem é determinada geneticamente está sujeita 
à mais imediata refutação do tipo mais forte. Hipóteses desse tipo já foram re- 
futadas mais de uma vez observando-se um outro fenômeno na mesma língua, 
ou uma outra língua. É por isso que é tão dificil formular hipóteses especifi- 
cas sobre estruturas geneticamente determinadas. [...] Se a hipótese é refuta- 
da numa outra língua, então ela é errada [para todas), Assumindo, é claro, a 
uniformidade da espécie — estou tomando como dado que não há subespécies 
de humanos -, então se alguém propõe a propriedade P e diz que ela é genetica- 
mente determinada, então essa proposta está sujeita à mais imediata refutação 
ao se olhar para outra língua na qual se possa demonstrar que a propriedade P 
não se aplica. 


Nesse ponto, Cellérier (p. 80) intervém: “Se você encontrar uma proprieda- 
de universal, ainda assim você não pode demonstrar que ela é inata”, ao que 
Chomsky (p. 80-81) responde: 


Não se pode efetivamente provar que ela é inata. Isso se dá porque estamos 
lidando com ciência, não com matemática. Mesmo que observássemos os genes, 
não poderíamos provar isso. Em ciência, não há inferências demonstrativas; em 
ciência, nós acumulamos evidências empíricas compatíveis com certas hipóte- 
ses, que assim nos parecem sensatas. E isso é tudo o que podemos fazer; fora 
disso estaríamos fazendo matemática. Mas penso que podemos encontrar mui- 
tas evidências convincentes, embora certamente menos convincentes do que 
seriam se pudéssemos lidar com humanos como lidamos com moscas. 


Então, Piaget (p. 81) interpela: “Primeiramente, generalidade, por si só, não 
é prova do inatismo; em segundo lugar, a questão é saber se a generalidade 
é comum a todos os níveis de desenvolvimento ou se ela se obtém ao final”, 
Chomsky (p. 81) rebate: 


Concordo com ambos os pontos. O fato de algo ser geral é uma evidência que 
corrobora a tese inatista, mas não demonstra que tal coisa é inata. Por outro 
lado, se algo não é geral, então certamente não é inato. Mas estamos aqui inte- 
ressados em descobrir propriedades que são biologicamente necessárias, e gene- 
ralidade é uma delas, embora não seja uma propriedade suficiente. 


Após essa breve incursão às origens do tema em discussão, retomo 
elementos apresentados em $5.5, conectando-os com o que acabamos de 


331 


apreciar. Mostre-me uma criança que sistematicamente produz dados vio- 
ladores da restrição de ilha, como (16b), ou então uma comunidade em que 
os adultos aceitam e usam tal estrutura, e você terá derrubado, por vias em- 
píricas, o argumento de que essa restrição de ilha é um conhecimento inato 
oriundo da GU. O mesmo vale para generalizações extraídas do paradigma 
em (18), que nos conduzem à conclusão de que o Princípio C é inato, ou a 
qualquer fato atrelado a um APE. 

Sem tais fatos novos, você só poderia refutar a tese inatista se demons- 
trar que ao menos uma das premissas em (13) é falsa no que conceme às 
regras gramaticais em pauta (i.e. restrição de ilha adjunto, Princípio C, 
etc.). Mesmo nesse caso, a hipótese anti-inatista ainda enfrenta outro ônus 
da prova. Digamos que não haja princípios inatos especificamente gra- 
maticais e que as opções das crianças por certas extrapolações indutivas 
em detrimento de infinitas outras se sigam de princípios de um aparato 
geneticamente determinado de caráter geral, o qual “gerencia” a aquisi- 
ção de linguagem do mesmo modo que “gerencia” qualquer aprendizagem. 
Consequentemente, espera-se que haja, em outros domínios cognitivos, 
algum correlato, manifesto em alguma forma mais transparente ou menos, 
de padrões estruturais como de ilhas, princípios de ligação A, Be C, mi- 
nimalidade relativizada, etc. Sem demonstrar isso, o anti-inatista apenas 
afirma sua posição sem evidência para corroborá-la. 

Se você não for capaz de prover contra-argumentos ou novas evidên- 
cias na direção do exposto acima, então só lhe resta aceitar que a tese da 
GU inata — embora podendo vir a ser demonstrada falsa no futuro — ainda 
é a melhor proposta atualmente existente. A rigor, ela é a única. As demais 
são acenos, promessas, não teorias de fato. Muitos críticos apenas especu- 
lam sobre o tema in abstracto, sem analisar dados empíricos ou analisando 
poucos dados irrelevantes, exemplos de “coisas brancas”. Outros analisam 
aspectos bem pontuais de poucas “coisas verdes”, mas sem aprofundamen- 
to nem compreensão; logo, sem oferecer uma teoria de aquisição com co- 


bertura empírica suficiente para descartar a tese da GU inata. Contudo, 
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abundam afirmações em contrário desprovidas de demonstração. Segundo 
Tomasello (2004: 643), “[tJodos os fenômenos empíricos tipicamente cita- 
dos como evidência em favor de uma GU inata são também consistentes 
com a existência de adaptações biológicas de habilidades mais gerais da 
cognição e da comunicação humanas”. É fácil afirmar isso, como fez Piaget 
(1980a, 1980b, 1980c). Mas para demonstrar sua validade deve-se escruti- 
nar todas as “coisas verdes” e explicitar de que modo as estratégias gerais 
da cognição derivariam F,como resultado sem haver princípios especifica- 
mente gramaticais em F 

Outra objeção muito comum ao APE resume-se à ingênua afirmação 
de que, embora a criança reconhecidamente não tenha acesso a dados ne- 
gativos, ela teria acesso à chamada evidência negativa indireta (cf. Cowie 
1999; 223-225, inter alia). Trata-se da ideia de que a ausência de certos tipos 
de estrutura em E, uma vez notada pela criança, faria com que ela infira 
que há mecanismos gramaticais subjacentes que proíbem a geração de tais 


estruturas, caso contrário ao menos algumas instâncias delas já teriam sido 


escutadas, por se tratarem de combinações triviais e esperadas de acordo 
com as regras combinatórias até então sabidas. O primeiro problema desse 
raciocínio foi muito bem resumido por Marcus (1999: 294), para quem 
“evidência negativa implícita só é útil se o aprendiz já souber de antemão 
quais não ocorrências são relevantes e quais não são” A propósito, Pinker 
(1989: 14) já esclarecia: 
[NJão é nada claro o que a evidência negativa indireta poderia ser. É inconce- 
bível que a criança rejeite literalmente toda e qualquer sentença que ela nunca 
escutou, pois sempre haverá uma infinidade de sentenças que ela jamais escutou 
e que são gramaticais |...) São trivialmente verdadeiras tanto a assunção de que 
a criança adota hipóteses gramaticais que descartam algumas das sentenças ja- 
mais escutadas, como a assunção de que, se a criança escuta uma dada sentença, 
ela vai mais provavelmente contemplar uma hipótese gramatical diferente da 
que contemplaria se não a tivesse escutado. A questão então é: sob quais circuns- 
tâncias, exatamente, a criança conclui que um dado não escutado é agramatical? 


Voltemos à restrição de ilha de oração subordinada adjunto discutida 
em $5.5. Digamos que tal regra proibitiva não seja inata, e que a criança, 
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muito perspicazmente, nota que, dentre todas as sentenças que escutou 
e que exibiam movimento de sintagma-QU extraído de dentro de uma 
oração subordinada, em nenhum dos casos a oração subordinada era não 
complemento. A questão é por que todas as crianças prestam atenção nes- 
se tipo de não ocorrência, e não em não ocorrências de outro tipo, como, 
por exemplo, o fato de todo o material morfossintático entre o sintag- 
ma-QU e seu vestígio (lacuna) ter mais ou menos palavras que o material 
sintático que se segue ao vestígio. São infinitos os tipos de não ocorrência. 
Portanto, ainda que a regra proibitiva em questão não seja inata, é ines- 
capável concluir que há um viés inato, especificamente gramatical, que 
orienta a criança para prestar atenção na distinção entre complemento e 
não complemento nas orações subordinadas contendo um vestígio de um 
sintagma-QU fronteado. Para tanto, é preciso assumir uma GU inata”. 
Outro problema com a ideia de evidência negativa indireta é o fato de 
isso pressupor que a criança passa por um estágio em que a regra relevan- 
te, por não ser inata, ainda não teria sido inferida via evidência negativa 
indireta. Isso seria facilmente demonstrado se houvesse registros de fala 
infantil contendo dados como (16b), que violam frontalmente o princípio 
em questão; ou então evidências experimentais de que crianças aceitam 
dados como (16b) atribuindo-lhes a interpretação relevante. O mesmo se 
pode dizer sobre (18b) e (18c) sob interpretações com correferência entre 
ela e Alice, e entre Alice e Alice, respectivamente. Não é isso o que temos. 
Logo, o apelo à evidência negativa indireta não explica os fatos relevantes. 
Para uma discussão completa e definitiva sobre o tema, cf. Yang (2016). 


34. Cabe frisar que a noção de evidência negativa indireta já foi seriamente levada em con- 
sideração por inatistas (e.g. Lasnik 1990: cap 9), tendo sido evocada pelo próprio Chomsky 
(1981a: 8-9). Porém, quando esses autores falam em evidência negativa indireta, eles não 
estão negando a GU inata. Ao contrário, a ideia contemplada é que, em relação a certas 
estruturas particulares, a GU não impõe uma regra universal, mas sinaliza determinado 
tipo de construção como um ponto relevante de variação entre gramáticas particulares, de 
modo que o aprendiz nasce enviesado para prestar atenção naquilo. Tal viés é um conheci- 
mento especificamente gramatical e inato. 
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Descartado o conceito de evidência negativa indireta, passemos à 
distinção entre pobreza e ausência de estimulo feita pelos anti-inatistas 
Pullum & Scholz (2002: 15-16). Em ambos os casos, pode-se construir ar- 
gumentos em favor de princípios inatos da GU, mas convém não misturá- 
-los sob o mesmo rótulo, pois a lógica argumentativa e a metodologia são 
distintas. No caso de pobreza, trata-se de dados positivos cuja raridade, na 
prática, pode torná-los invisíveis ou não, a depender do quão raros eles são. 
No caso de ausência, trata-se de dados negativos inquestionavelmente ine- 
xistentes em E, logo incapazes de deflagrar aprendizagem. Os argumentos 
de pobreza de estímulo (no sentido estrito dos referidos autores) seriam, em 
princípio, mais controversos e mais passíveis de crítica ou refutação, pois, 
nesses casos, a verdade da premissa em (13c) acima — acerca do acesso ou não 
da criança à informação relevante — dependeria de assunções e demonstra- 
ções adicionais sobre o que seria suficiente ou não em relação à quantidade 
de certos exemplos presentes em E. Os dois exemplos ilustrativos de APE 
que abordo aqui — assim como a grande maioria dos APEs propostos no 
âmbito da GGT — se qualificam como argumentos de ausência de estímulo, 
estritamente falando. Essa distinção se mostra mais relevante e mais com- 
plexa quando alargamos a nossa base empírica, considerando interações 
não triviais de fenômenos que mascaram uns aos outros. Retornemos aos 
dados em (15) e (16)”, que evidenciam a restrição de ilha de adjunto, e 
acrescentemos ao paradigma os dados em (19) e (20), já vistos em $2.5. 


(19a) Quem, (que) Léo alertou Q, [que Zé espionava Cris]? 
(19b) Quem, (que) Léo alertou O, [que Zé espionava O,]? 

(202) Quem, (que) Léo alertou O, [enquanto Zé espionava Cris)? 
(20b) Quem, (que) Léo alertou O, [enquanto Zé espionava O)? 


35. (154) Léo alertou você que Zé espionava Cris; (15b) Quem, Léo alertou você que Zé 
espionava O, (16a) Léo alertou você enquanto Zé espionava Cris; (16b) *Quem, Léo aler- 
tou você [enquanto Zé espionava O,]? 
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Todos esses dados são positivos (cf. $2.5, n. 45), e o principal deles é 
(20b). Logicamente, (19a) está para (20a) assim como (19b) está para 
(20b). Em (20b), a lacuna dentro do adjunto está, no plano puramente 
semântico-pragmático, associada ao sintagma deslocado, estabelecendo o 
mesmo tipo de relação proibida em (16b) acima. Temos aqui mais do que 
pobreza de estímulo (i.e. a ausência da evidência de que (16b) é agramati- 
cal). Temos um excesso de estímulo (i.e. a evidência de que (20b) é grama- 
tical) que induziria o aprendiz à hipótese errada (mas totalmente compa- 
tível com os dados da experiência) de que não há restrição de ilhas, e que 
portanto (16b) também seria gramatical. Na tradição da GGT, analisa-se 
(20b) em termos de mecanismos de licenciamento de lacunas parasitas. Ou 
seja, em (20b), a categoria vazia dentro do adjunto (i.e. a lacuna parasita) 
não é diretamente dependente do sintagma deslocado. Ela está coindexada 
ao vestígio do sintagma deslocado (i.e. a lacuna real), que, por sua vez, está 
coindexado (via movimento) ao sintagma fronteado. Somando-se a res- 
trição de ilha aos mecanismos de licenciamento de lacunas parasitas (am- 
bos necessariamente parte da GU), temos um quadro coerente que prevê a 
agramaticalidade de (16b) a despeito da gramaticalidade de (20b). 

Contudo, uma criança desprovida de GU não teria meios para concluir 
isso; e é perfeitamente compatível com a sua experiência uma gramáti- 
ca mais simples, sem nenhum desses dois princípios, segundo a qual, em 
(20b), tanto a categoria vazia dentro do adjunto como a categoria vazia 
fora dele estariam ambas diretamente associadas ao sintagma movido, sem 
associação direta (apenas indireta) entre as duas categorias vazias. Isso faria 
a previsão de que (16b) fosse gramatical. Assim como a agramaticalidade 
de (16b) é uma exceção ao padrão aparente, temos também que a grama- 
ticalidade de (20b) é uma exceção ao padrão oculto que explica a agrama- 
ticalidade de (16b) através da noção de ilha adjunto enquanto princípio 
inato. E essa exceção da exceção só se explica através de um segundo padrão 
mais oculto ainda, que pressupõe a existência in tandem de ilhas adjunto e 
de lacunas parasitas. 
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(20b) é, pois, um dado positivo que corrobora a hipótese da inexistência 
da restrição de ilha adjunto. Isso é a princípio problemático já que (16b) é 
agramatical, o que só é possível se a restrição de ilha existir. Para o linguista, 
(16b) é um dado negativo acessível e que corrobora a hipótese da existên- 
cia da restrição de ilha adjunto. Do ponto de vista da criança aprendiz, no 
entanto, não há na experiência dado positivo ou negativo algum que corro- 
bore a hipótese da existência da restrição de ilha adjunto. O dado positivo 
(20b) estaria, portanto, conduzindo a criança à falsa conclusão de que não 
existiria a restrição de ilha adjunto, a qual, por sua vez, é responsável pela 
agramaticalidade de (16b). Ocorre que (20b) é gramatical em função dos 
mecanismos de licenciamento de lacunas parasitas, que, na superfície, têm 
o efeito de fazer parecer que a restrição de ilha adjunto estaria sendo afrou- 
xada (i.e. uma exceção da exceção). Qualquer dado como (20b) seria um 
excesso de informação que só atrapalha ainda mais a criança a descobrir a 
restrição de ilha adjunto, que, por si só, já é demasiado oculta. O impacto 
desse excesso de estímulo é tanto maior quanto maior for a falta de certas 
informações específicas na mesma massa de dados, e vice-versa. 

Em todos os casos de “exceção da exceção; a questão da presença/ausên- 
cia e frequência/infrequência dos dados relevantes se coloca duplamente. 
Logo, se concedermos ao anti-inatista que dados positivos raros devem ser 
tratados como informação devidamente processada pela criança para fins 
de detecção de padrões (i.e. mesmo raros eles existiriam em quantidade 
suficiente), então, por exemplo, dados envolvendo lacunas parasitas como 
(20b), acabariam por alavancar, na criança, a falsa crença na hipótese de 
que a gramática alvo não teria restrição de ilha, e de que (16b) seria gra- 
matical. Se, por outro lado, dados como (20b) forem super-raros, a ponto 
de isso não reforçar a falsa crença na inexistência da restrição de ilha (e 
consequente gramaticalidade de (16b)), não temos o problema de excesso 
de estímulo, mas temos uma potencialização do problema de pobreza de 
estímulo em relação aos princípios da GU que regulam o licenciamento de 
lacunas parasitas, posto que, nesse outro cenário, os dados raros contariam 
como inexistentes para todos os efeitos práticos. 
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Limites de espaço e escopo me impedem de elaborar a respeito de todo 
um intenso debate na literatura técnica contemporânea acerca dos chama- 
dos modelos conexionistas, que propõem que o que haveria de inato em 
F seria uma capacidade geral de fazer generalizações através do cálculo da 
probabilidade de ocorrência associada entre dois (ou mais) eventos, com 
base nas ocorrências associadas de eventos previamente observados, o que 
acaba por 'cristalizar' a expectativa de reencontrar certos padrões frequen- 
temente encontrados. O mesmo processo acabaria por 'cegar” o sistema, 
impedindo-o de antever como potencialmente encontráveis eventuais pa- 
drões jamais encontrados na massa de dados. Remeto o leitor a Fodor & 
Pylyshyn (1988, 1990) e Yang (2016) para uma refutação desse paradigma. 
Na próxima seção, mesmo sem discutir os detalhes técnicos sobre os meca- 
nismos de construção dessas 'expectativas, ressalto que tal tarefa esbarra em 
problemas básicos referentes a quais propriedades dos dados prestar aten- 
ção, e ao número literalmente infinito de hipóteses a serem consideradas. 


55.7. EXCESSO DE ESTÍMULO, FINITUDE DO ESPAÇO DE 
HIPÓTESES, PRINCÍPIOS E PARÂMETROS 


O APE estabelece que, devido à ausência de certas informações (da- 
dos negativos) necessárias para inferir certos padrões a partir puramen- 
te de dados em E via mecanismos cognitivos gerais de detecção de pa- 
drões via indução, a tarefa de aquisição de linguagem (consolidação de 
F,) depende crucialmente de princípios gramaticais inatos em F,. Nesta 
seção, argumento que o problema da inadequação de E para a forma- 
ção de E,a partir de F, é de caráter mais geral. Além do que Chomsky 
(1986a) chamou de Problema de Platão, a criança enfrenta o que eu cha- 
mei de Problema de Borges em Guimarães (2013: 158-159)*%. O primei- 
ro diz respeito à escassez de informação em E. O segundo diz respeito 


36. Antecedentes históricos dessa minha ideia encontram-se em Guimarães (2007) e 
Becker et al. (2011). 
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ao excesso de informação em E. Trata-se de problemas complementares 
que, juntos, tornam a tarefa de aquisição de linguagem “missão impossí- 
vel, a menos que haja uma GU inata. 

Frequentemente, críticos do inatismo ingenuamente alegam que, ao 
contrário do que o APE estabelece, o estímulo seria rico (Chouinard & 
Clark 2003; Tomasello 2003, 2004; Everett 2005, 2006; inter alia), posto 
que a experiência da criança com os dados positivos não se resume à escu- 
ta de enunciados de sentenças, mas também a uma complexa miríade de 
informações contextuais associadas: os eventos ocorridos antes, durante e 
depois do ato de fala, o papel do enunciador, do enunciatário e de tercei- 
ros nesses eventos, as relações de causa e efeito que se podem inferir entre 
eventos, etc. E tudo isso é perceptível através de estímulos sensoriais vários. 
De fato, há muitíssima informação em E. Mas isso se configura em rique- 
za de estímulo no sentido relevante? Isso depende da natureza exata das 
muitas informações presentes em E. Nenhum inatista nega que elementos 
contextuais exerçam um papel importante no desenvolvimento cognitivo 
como um todo, inclusive na internalização de gramática. Afinal, as senten- 
ças da gramática só são acessíveis e compreensíveis enquanto expressão de 
pensamentos acerca de um complexo estado de coisas que circunda o indi- 
víduo. O problema está em apostar cegamente — sem investigação e cálculo 
de previsões prévios — na ideia de que tais informações contextuais bas- 
tam, sem sequer examinar a qualidade delas, apenas 'dando de barato” que a 
mera quantidade delas é suficiente. De nada adianta E ser uma experiência 
quantitativamente rica se, em meio à quantidade colossal de informações 
ali contidas não houver uma sequer do tipo relevante e necessário para a 
tarefa específica de inferir a existência de uma dada regra gramatical R. 

Se eu tiver a minha garagem toda ocupada por jornais velhos, garrafas 
pet usadas, restos de flores mortas, etc., isso não faz de mim um homem 
rico no sentido estrito de poder aquisitivo. Se a garagem estivesse repleta de 
cédulas de 100 dólares, barras de ouro, telas de Picasso, etc., eu seria multi- 
milionário. Imagine agora que você herda um imóvel gigante, um hangar, 
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cujo espaço está todo ocupado por milhares de coisas sem valor, como jor- 
nais velhos, mas no meio da grande bagunça há uma tela de Picasso. Tec- 
nicamente, você é rico. Mas sua riqueza está perdida e inutilizável até que 
você consiga cumprir a hercúlea tarefa de “achar a agulha no palheiro” Até 
lá, você permanece tão pobre quanto antes para efeitos práticos. 

O que chamo de Problema de Borges é comparável à tarefa de achar a 
tela de Picasso num enorme hangar repleto de lixo. Pior que isso, a tarefa 
em questão é não apenas dificílima, mas impossível porque pressupõe um 
hangar infinitamente grande contendo uma quantidade infinita de lixo. A 
inspiração para o nome do problema vem do conto Funes, el memorioso, 
do ficcionista argentino Jorge Luis Borges. O protagonista Irineo Fu- 
nes é dotado de uma memória perfeita que registrava absolutamente tudo 
sem jamais esquecer de nada, e de uma percepção ultra-aguçada, com uma 
acuidade dos sentidos sobre-humana, capaz de detectar todo e qualquer 
detalhe, por mais infinitesimal que seja, em tudo o que se vê, escuta, toca, 
cheira e degusta. O que parece à primeira vista ser uma grande vantagem 
de Funes sobre nós mortais comuns acaba sendo fonte de sofrimento e de- 
ficiência cognitiva extrema para ele. Como consequência de seus superpo- 
deres, Funes sempre detecta diferenças entre coisas que nós jamais per- 
cebemos. Logo, ele é incapaz de fazer generalizações sobre a realidade, 
O que pressupõe tomar duas ou mais coisas como exemplares distintos de 
uma mesma coisa. Para construir generalizações, é preciso ignorar certas 
diferenças entre os exemplares, algo que ele não consegue porque detalhes 
infinitesimais lhes são demasiado salientes e inesquecíveis. 

Assim seriam as crianças em relação à aquisição de gramática se não 
houvesse uma GU inata direcionando-as a prestar atenção nas propriedades 
relevantes dos dados e ignorar as irrelevantes. Tal (ir)relevância não tem 
como ser logicamente inferida diretamente de E via mecanismos cogniti- 
vos gerais. Para que muitas informações observadas sejam descartadas, elas 
precisam ser ignoradas a priori. É impossível analisar todas elas para depois 
descartar várias sob algum critério, pois isso envolveria uma função não 
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computável, logo não executável dentro dos limites da capacidade cogniti- 
va humana de processamento e memória. O problema é insolúvel porque 
seria infinita a quantidade de experiências a serem ou não consideradas no 
processo de aquisição, bem como a quantidade de hipóteses logicamente 
possíveis acerca dos mecanismos gramaticais que gerariam todos os dados. 
Não se trata de ignorar ou descartar os dados em si, mas de ignorar ou des- 
cartar hipóteses acerca da relevância ou não de diversas (a rigor, infinitas) 
propriedades dos dados, as quais seriam levadas ou não em consideração 
quando da formulação de hipóteses sobre os mecanismos gramaticais, da 
comparação e decisão entre elas. Sem uma GU restringindo a priori o espaço 
de hipóteses a um tamanho finito, a internalização de uma gramática com- 
patível com os dados da experiência é logicamente impossível, porque en- 
volveria necessariamente infinitas possibilidades a serem consideradas uma 
a uma antes de se tomar uma decisão. 

A questão da restrição do espaço de hipóteses tem sido colocada recen- 
temente por outros autores, dentre os quais destaco Charles Yang, William 
Sakas, Lisa Pearl e Jeffrey Lidz. Implicitamente, isso já estava posto mais ru- 
dimentarmente desde as primeiras formulações dos conceitos de princípio 
e parâmetro (cf. Chomsky 1981a, et seq.), até suas versões mais elaboradas e 
recentes (cf. Yang 2002). Entretanto, a explicitação do Problema de Borges se 
faz necessária na medida em que ele, de modo mais radical e definitivo, reve- 
la a inexorabilidade da infinitude de hipóteses e sua incomputabilidade caso 
a criança não encare a tarefa de aquisição de linguagem partindo de uma 
GU inata, Quanto mais informação tiver de ser processada, maior e mais 
complexa é a tarefa de “separar o joio do trigo” e “achar a agulha no palheiro” 
em relação ao que é relevante ou não para desvendar os padrões ocultos. 

Como já demonstrado em $5.5, os dados em E, em estado bruto, são 
compatíveis com uma gama não apenas gigantesca como infinita de pos- 
síveis padrões ocultos, dentre os quais a criança teria que selecionar quais 
são de fato parte da gramática e quais são apenas potencialidades mate- 
máticas. Sem uma GU inata, viveríamos todos o drama de Irineo Funes ao 
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nos confrontarmos com infinitas possibilidades de abordagem dos dados. 
Isso não pressupõe que a criança enfrente infinitos dados. Uma amostra 
pequena já instancia o problema, porque qualquer evento observável úni- 
co pode ser visto como exemplar de infinitas categorias abstratas. Para o 
aprendiz concluir quais dos infinitos padrões ocultos de fato são operan- 
tes na língua, é preciso comparar hipóteses acerca desses padrões ocultos 
com os dados positivos observáveis e checar a compatibilidade de cada 
dado com cada hipótese, para assim ir descartando as hipóteses erradas 
até se chegar a um afunilamento das hipóteses restantes, que, juntas, cons- 
tituiriam a gramática internalizada. 

Para tanto, deve-se partir de um conjunto de hipóteses, aqui denomina- 
do de espaço de hipóteses. Qual é o tamanho desse espaço? Evidentemente, 
quanto mais hipóteses houver para serem testadas, mais árdua é a tarefa 
de aquisição, mais comparações precisam ser feitas. De onde se originam 
essas hipóteses? Elas são formuladas a partir da observação dos dados? Se 
sim, com base em que critérios? Por exemplo, por que razão a criança co- 
gita uma hipótese baseada na ordem de palavras, ou na curva melódica, 
ou na estrutura métrica das palavras, ou na estrutura sintagmática, etc.? 
Se o espaço de hipóteses não for delimitado de alguma forma, teríamos a 
situação-limite em que há infinitas hipóteses a serem consideradas. Isso 
torna a tarefa de afunilamento do espaço literalmente inexequível. Vejamos 
por que isso se daria. Primeiramente, consideremos alguns cenários bem 
simples, sem nos preocuparmos ainda com a origem das hipóteses, apenas 
com o número delas, com o tamanho do espaço. 

Em (21) temos um espaço de hipóteses com apenas duas opções quanto 
à ordem relativa entre núcleos e complementos, tal como preveem as ver- 
sões canônicas da Teoria X-Barra, construídas no âmbito da TRL, em que a 
GU é concebida em termos de princípios universais (nesse caso, as relações 
de irmandade entre X e YP e de dominância imediata de X' sobre X e YP) 
e de parâmetros de variação, que são espaços pré-delimitados pela GU nos 
quais mais de uma versão de um mesmo construto gramatical são admissí- 
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veis, mas apenas uma delas é instanciada efetivamente em cada gramática 
particular, e todas as opções já estão previamente dadas no espaço de hipó- 
teses fornecido pela própria GU. 


(210) Hi: XIXYP (ordem: núcleo'complemento) 
H2: X5YPX (ordem: complemento”núcleo) 


O cenário em (21) é bem simples. Se a criança escuta dados do portu- 
guês (e.g. Eu comi romã), ela retém H1 e descarta H2. Se ela escuta dados 
do japonês (e.g. Watashi-ga rakuro-o tabemashita (=Eu romã comi)), ela 
retém H2 e descarta H1. Antes de a testagem ocorrer, a probabilidade ini- 
cial de cada hipótese seria de 1/2 (=50%), a não ser que houvesse algum 
viés apriorístico que atribuísse peso maior a uma dessas hipóteses no início 
(cf.n. 26). 

Consideremos agora um cenário com quatro hipóteses no espaço, como 
esboçado em (22), concernentemente ao movimento de sintagmas-QU 
em orações interrogativas (cf. chinês, inglês, português brasileiro e russo, 
respectivamente). 


(22) Hi: Nenhum sintagma-QU é movido; 
H2: O sintagma-QU mais próximo do alvo é deslocado para a periferia 
esquerda; 
H3; Opcionalidade entre não mover nenhum sintagma-QU ou deslocar 
para a periferia esquerda aquele que se encontrar mais próximo do alvo; 
Ha: Todos os sintagmas-QU são deslocados para a periferia esquerda. 


Antes da testagem, a probabilidade inicial de cada hipótese seria de 1/4 
(=25%), a não ser que houvesse algum viés apriorístico em favor ou contra 
uma dessas hipóteses. E se, para um dado fenômeno gramatical, a criança 
estiver considerando um espaço de hipóteses com 1000 hipóteses? A proba- 
bilidade inicial de cada hipótese seria de 1/1000 (=0,1%). 

Se o espaço de hipóteses fosse infinito, teríamos infinitas hipóteses, cada 
uma com probabilidade inicial de 1/20, que equivale a zero. Isso significa, 
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literalmente, que o aprendiz inicia seu processo de testagem com a certeza 
de que todas as suas hipóteses estão erradas, e não com uma dúvida relativa 
acerca de qual hipótese está certa, sabendo que todas elas tém uma igual 
chance (maior ou menor) de estar certa. Pode-se argumentar que eu estou 
apenas aplicando um truque retórico para conferir maior dramaticidade 
ao cenário considerado, pois a “certeza de que todas as hipóteses estão 
erradas” teria talvez um caráter conclusivo de que a tarefa de aprendizagem 
é impossível, fazendo o aprendiz desistir, e assim a metáfora do drama de 
Irineo Funes cairia como uma luva. Invertamos a situação, então. Todas as 
infinitas hipóteses teriam a mesma chance de não estar erradas, o que faria 
com que todas fossem vistas como corretas a priori. Se isso for verdade, 
então nenhuma testagem se faz necessária. Mas isso é absurdo, pois várias 
dessas hipóteses fazem previsões que contradizem umas às outras, não po- 
dendo todas estar certas ao mesmo tempo. O que o aprendiz faria, então? 
Um sorteio entre as hipóteses? Se for esse o caso, esperaríamos que cada 
criança acabasse internalizando uma gramática cujo formato seria impre- 
visível. Enfim, para que a tarefa de aquisição seja computável, o espaço de 
hipóteses precisa ser finito. 

De que se segue a finitude do espaço de hipóteses? Como vimos em $5.5 
e $5.6, ela não se segue de propriedades observáveis dos dados brutos, pois 
eles são compatíveis com infinitos padrões ocultos hipotéticos. Tomemos 
novamente as ilhas adjunto, considerando a hipótese correta, e algumas 
apenas potenciais, mas que são compatíveis com a experiência, 


(23) HI: O fronteamento do sintagma-QU é permitido, exceto se o sintagma-QU 
A jungid ; 


H2: O fronteamento do sintagma-QU é permitido. 


H3: O fronteamento do sintagma-QU é permitido, exceto se ele for sujeito de um 


H4: Mover o sintagma-QU de sua posição original para o início da sentença ma- 
triz, i irigi i R 


Em (23), a hipótese H1 é a regra que efetivamente existe nas línguas 
naturais, embora, como discutido em $5.5, ela seja inaprendível a partir da 


experiência, por consistir de uma cláusula restritiva do tipo “exceto se 


que, para ser aprendida, requer dados negativos indisponíveis. A hipótese 
H2, sem nenhuma cláusula restritiva, é aquela que legitimaria (16b) como 
gramatical, Se uma criança internalizasse H2, ela acabaria aceitando e pro- 
duzindo dados desse tipo. Sabemos que isso não ocorre, logo a questão que 
se coloca é como a criança sabe que H2 deve ser descartada, já que não há, 
na experiência, nenhum dado positivo que indique que H1 é a regra corre- 
ta, em vez de H2. Note que H2 é estruturalmente muito mais simples, sem 
nenhuma cláusula restritiva do tipo “exceto se...” Na ausência de evidência 
robusta, qualquer métrica de simplicidade favoreceria H2 sobre H1, mas 
não é isso o que acontece. Mais que isso, qualquer métrica de simplicida- 
de desfavoreceria toda e qualquer hipótese com qualquer tipo de cláusula 
restritiva do tipo “exceto se...” por elas serem inerentemente mais com- 
plexas. Obviamente, se houver uma hipótese com uma cláusula restritiva 
facilmente descartável por dados positivos, ela será descartada. Por exem- 
plo, no caso de uma hipótese com a cláusula “exceto se o sintagma-QU for 
objeto de um verbo flexionado no plural”, basta que a criança escute dados 
positivos como Quem, vocês viram O, ontem? para que o descarte se dê. 
Entretanto, não se pode dizer o mesmo de todas as cláusulas restritivas lo- 
gicamente possíveis, e elas são em número infinito, literalmente. 

H3 e Ha são apenas dois de infinitos exemplos logicamente possíveis de 
cláusulas restritivas totalmente compatíveis com os dados da experiência 
e que, no entanto, jamais são sequer cogitadas pelo aprendiz. Se fossem 
cogitadas, tais hipóteses estariam em pé de igualdade com H1 em termos 
de (ausência de) evidência e em termos de compatibilidade com os dados 
positivos disponíveis. Isso acarretaria o problema de todas essas infinitas 
hipóteses terem probabilidade zero de estarem corretas, o que vale também 
para HI! Por que, então, a criança sequer cogita H3 e H4 ou qualquer outra 
hipótese com outro tipo de cláusula restritiva impossível de ser descartada? 
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Resposta: é a GU que lhe impõe H1. Note que, uma vez adotada, H1 tam- 
bém é tão impossível de ser descartada quanto H3 ou H4 (lembrando que 
nada impede que essas hipóteses coexistam), dadas a natureza e a escassez 
dos dados que as refutam. Na ausência de uma GU que estabeleça a priori 
H1 (ou melhor, sua cláusula restritiva) como a única hipótese (de regra 
restritiva) pertencente ao espaço de hipóteses, teríamos não apenas H3 e 
H4 como concorrentes no infinito espaço de hipóteses. 

A existência de um espaço de hipóteses infinito enfrenta um sério pro- 
blema de computabilidade e de realidade psicológica. O grau de comple- 
xidade da testagem e comparação de infinitas hipóteses é infinito, logo 
incomputável, inexequível pelo cérebro humano num período de tempo 
finito (e curto). Mais que isso, a própria existência de infinitas hipóteses 
num espaço, mesmo sem que se faça nenhuma operação de testagem sobre 
elas, já se configura num problema insolúvel, pois isso exigiria que o cére- 
bro humano fosse infinito em capacidade de memória. A única alternativa 
não inatista, então, seria assumir que, no início do processo, o espaço de 
hipóteses é vazio, e as hipóteses seriam todas elas formuladas no decorrer 
da experiência da criança com os dados, “inspiradas” pelos dados. 

Teríamos aí dois problemas também insolúveis. Primeiramente, os da- 
dos são infinitamente inspiradores. Esse é o problema do excesso de in- 
formação presente nos dados, por menor que seja a amostra. As hipóteses 
H3 e H4 podem parecer absurdas à primeira vista. Entretanto, de um pon- 
to de vista estritamente lógico, partindo da premissa de que não haveria 
GU, essas duas hipóteses e infinitas outras são formuláveis puramente com 
base em propriedades dos dados. Entenda-se aqui 'dado' como não apenas 
a sentença per se, mas o enunciado e as circunstâncias de enunciação. Por 
que, por exemplo, características físicas do interlocutor (evocadas em H4) 
seriam relevantes, se são fatos extragramaticais? 

A pergunta é: por que não? Um aprendiz não dotado de uma GU não 
teria nenhum viés quanto às fronteiras que delimitam o que é uma gra- 
mática, o que pode ou não interferir na forma das sentenças. Sob essa 
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perspectiva, todo e qualquer dado, por mais simples que seja, encerra em 
si literalmente infinitas propriedades. Sendo assim, o que garante que a 
criança, nos limites da sua capacidade finita de formular hipóteses, formu- 
laria H1 entre elas? Por que H1 e não H3, por exemplo? Do ponto de vis- 
ta de um aprendiz que não estaria aprioristicamente enviesado por uma 
GU inata, H1 é tão absurda quanto H3 e H4. Por que sintagmas adjunto 
seriam domínios 'trancados' para extração de sintagmas-QU? Em termos 
semântico-pragmáticos, não há absurdo algum em (16b) ser gramatical 
com a interpretação trivial parafraseável como “Eu lhe peço que me revele 
a identidade da pessoa x, tal que Léo alertou você enquanto Zé espionava 
x”, por analogia à interpretação efetivamente atribuída a (15b), a saber: 
“Eu lhe peço que me revele a identidade da pessoa x, tal que Léo alertou 
você que Zé espionava x”. É esse caráter não absurdo de (16b) em termos 
semântico-pragmáticos que torna estranha a hipótese H1, que proíbe a 
existência de um dado com todas as características relevantes para ser ple- 
namente funcional em termos comunicativos. 

Sem nenhum viés apriorístico da GU, formular hipóteses com base na 
inspiração dos dados seria como apostar numa loteria, com uma chance 
infinitesimal de H1 sequer existir no espaço de hipóteses, pondo de lado 
o problema já mencionado de como testar as hipóteses concorrentes e es- 
colher entre elas com base em dados compatíveis com múltiplas delas (li- 
teralmente infinitas). Na verdade, o problema é mais sério que isso. Se o 
espaço de hipóteses for vazio no início do processo e as hipóteses tiverem 
de ser formuladas, é zero (i.e. 1/2) a chance de que — independentemente 
de quantas e quais hipóteses concorrentes forem formuladas — a hipótese 
HI esteja entre aquelas 'criadas a partir dos dados. 

Ou seja, sem que o espaço de hipóteses seja aprioristicamente reduzido 
a um minimum minimorum pelos princípios da GU, a aquisição de gramá- 
tica é, literalmente, 'missão impossível, em função da incomputabilidade 
da tarefa, decorrente da infinitude de hipóteses, por sua vez decorrente do 
excesso de informações de fato contidas nos dados. 
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A solução, portanto, residiria numa concepção de gramática que 
pressupõe uma GU estruturada em termos de princípios e parâmetros, 
a qual, como ressaltou Chomsky (1981a: 3-4,11), cumpre a dupla tarefa 
de dar conta dos aspectos universais e variáveis das línguas: 


A teoria da GU deve satisfazer duas condições óbvias. Por um lado, ela 
deve ser compatível com a diversidade das gramáticas existentes (ou 
melhor, possíveis). Simultaneamente, a GU deve ser suficientemente 
restritiva quanto às opções que permite, de modo a dar conta do fato 
de que cada gramática dessas se desenvolve na mente a partir de evi- 
dências muito limitadas. Para muitos casos sujeitos a estudos minucio- 
sos recentemente, é praticamente certo que propriedades fundamentais 
das gramáticas desenvolvidas são radicalmente subespecificadas pelas 
evidências disponíveis ao aprendiz, devendo portanto ser atribuídas à 
própria GU. |...) O que esperamos atingir, então, é uma teoria altamente 
estruturada da GU baseada em um número de princípios fundamentais 
que limitam claramente a classe de gramáticas atingíveis, e restringem 
drasticamente suas formas, mas com parâmetros que devem ser especi- 
ficados pela experiência. Se esses parâmetros forem parte de uma teoria 
da GU cuja estrutura é suficientemente rica, então as línguas determi- 
nadas pela especificação de seus valores irão de algum modo aparentar 
ser bem diversas [...] [A] gramática [...] é apenas indiretamente relacio- 
nada com a experiência, numa relação mediada pela GU. [...] Se essas 
assunções estiverem corretas, então a GU disponibilizará apenas uma 
classe finita de gramáticas possíveis, a princípio. Isto é, a GU fornecerá 
um conjunto finito de parâmetros, cada um com um número finito de 
valores, além da questão trivial da lista de morfemas ou palavras, que 
certamente deverá ser majoritariamente aprendida via exposição direta. 
[...] A conclusão de que apenas um número finito de gramáticas está 
disponível a princípio tem consequências para a investigação matemáti- 
ca da capacidade gerativa e da aprendibilidade. 


O sêmen dessa visão vem de Chomsky (1976a: 135), baseado em ideias 
de François Jacob sobre a relação organismo-ambiente na variação e mu- 
dança genéticas (cf. também Chomsky 1980a: 67). 


Mesmo se as condições forem particulares de línguas ou de regras, há limites 
para a diversidade gramatical possível. Logo, tais condições podem ser consi- 
deradas como parâmetros a serem especificados (para a língua, ou para regras 
particulares, no pior cenário) na aquisição de linguagem [...] Tem-se assumido 
frequentemente que condições sobre aplicação de regras devem ser bem gerais, 
até universais, para serem significativas, mas que isso não é necessário se esta- 


belecida uma condição “paramétrica' que permita reduzir substancialmente a 
classe de regras possíveis. 


Finalizando, retomo um ponto que levantei em $2.7, oriundo de um ra- 
ciocínio de Clark & Roberts (1993) sobre como a abordagem de princípios 
e parâmetros acomoda a tensão entre universais e variáveis gramaticais no 
que concerne à aquisição e à mudança linguísticas, restringindo o conjunto 
de gramáticas humanamente possíveis. Digamos que a GU seja um siste- 
ma enxutíssimo que só admite 30 parâmetros (pontos de variação), todos 
binários (com apenas dois valores possíveis), Haveria então 1.073.741.842 
(=2”) gramáticas possíveis, o que parece largamente suficiente para lidar 
com a variação efetiva. 

A discussão sobre parâmetros que fiz aqui tem por base as versões ini- 
ciais desse conceito, que são variações e desenvolvimentos iniciais da pro- 
posta de Chomsky (1981a). Nas últimas três décadas e meia, muitas con- 
cepções mais heterodoxas e complexas de parâmetro já foram propostas, 
incluindo o próprio abandono dessa noção, em favor de outra visão do que 
seriam os vieses cognitivos apriorísticos. Para acessar essa discussão, reme- 
to o leitor a Biberauer (2008), Biberauer, Holmberg, Roberts & Sheehan 
(2014), e Boeckx (2011, 2014, 2015), inter alia. 
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S6. Sequências Terminais 


86.1. TERMINANDO 


Nos capítulos anteriores, apresentei a minha leitura da obra chomskyana 
como um todo. Obviamente, trata-se de uma entre muitas possíveis, não 
necessariamente a melhor. Porém, espero ter deixado claro que a minha 
versão da história, ainda que inexoravelmente subjetiva como a de qual- 
quer outro, foi construída objetivamente, tendo eu mergulhado na vasta 
obra chomskyana e escrutinado-a, o que me permitiu, com maior ou me- 
nor acurácia e relevância, traçar um mapa geral da edificação do paradigma 
chomskyano para o leitor iniciante ou para quem vem acompanhando a 
história da GGT meio de longe, sem saber dos detalhes, e que pode se bene- 
ficiar das informações que dou ao longo deste livro, para assim compreen- 
der Chomsky de modo mais próximo do integral. Se, por vezes, meu texto 
ficou um tanto 'pesado; com muitas referências e notas, esse é o preço que 
nós pagamos para que esta narrativa não seja apenas a minha leitura, mas 
também, e sobretudo, o relato de uma “testemunha ocular" que em vários 
momentos lhe empresta a luneta para que o seu olhar alcance mais longe do 
que se pode ver a olhos nus, mirando este volume ora em suas mãos. 

Admito, de saída e na saída, que há imprecisões e incompletudes na 
minha versão, algumas decorrentes das minhas limitações intrínsecas, ou- 
tras das circunstâncias de produção do texto. Como não poderia deixar de 
ser, foi feito um recorte, ao mesmo tempo criterioso e um tanto arbitrário, 
porque fruto da minha subjetividade de autor, por mais cartesianamente 


que eu proceda. Certas coisas foram apresentadas em mais detalhe. Outras 
foram apenas esboçadas ou até omitidas, em benefício da fluidez do texto. 
Umas tantas foram “mastigadas” didaticamente. Quanto a outras, adotei 
a postura tipicamente chomskyana de pressupor inteligência, perspicácia 
e conhecimentos prévios por parte do leitor, mesmo eu sabendo que, na 
prática, não existe esse leitor ideal, que no entanto é uma abstração neces- 
sária e inexorável, pois não tenho como escrever um livro distinto para 
cada um de vocês. 

Daqui pra frente, é com você! Encorajo (aliás, urjo) que você agora dê 
seus próprios mergulhos na literatura técnica da GGT. E não sejamos le- 
vianos; deve-se fazer isso dando ênfase às obras de Chomsky. Fingir que 
ele não se destaca dos demais autores só atrapalha, pois todos os outros 
autores que contribuíram mais significativamente para a GGT (inclusive 
os bons “advogados do diabo”) devoraram cada uma das notas de rodapé de 
Chomsky. Sugiro que você dê seus próximos passos guiando-se pelo roteiro 
traçado neste livro. É claro que outros roteiros são possíveis, mas este é o 
que eu tenho a oferecer, e o faço a partir da minha mais honesta leitura da 
obra chomskyana e da minha prática como pesquisador e professor, exal- 
tando os méritos e expondo as feridas sem pudores. E se você detestou este 
livro, ainda assim você tem um bom motivo para ler Chomsky direto nas 
fontes, e então me contestar. 

Como eu disse lá no início, cf. $1.1, não vim aqui gastar todo esse papel 
e tinta (e tempo e energia) para “converter você, mas para ajudar você a 
conhecer a GGT do lado de dentro, começando pelo começo. Espero ter 
conseguido atingir esse objetivo ainda que parcialmente. Por um lado, em- 
penhei-me em detalhar aspectos do paradigma chomskyano geralmente 
sonegados pelos autores de livros comparáveis a este, e que são ingredien- 
tes-chave para uma compreensão efetiva do tema. Por outro lado, dados os 
limites de espaço e a delimitação de escopo e de público-alvo, fui obrigado a 
fazer algumas simplificações e omissões um tanto quanto perigosas. Ainda 
reiterando o meu posicionamento inicial, cf. $1.1, sustento que, a despeito 
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de suas muitas falhas e incompletudes, a GGT é, de longe e com uma am- 
pla vantagem sobre as concorrentes, a melhor concepção de gramática de 
que dispomos até hoje. Quando eu disse isso nas primeiras páginas, trata- 
va-se de um recurso retórico para atrair tanto os leitores mais aprioristica- 
mente simpáticos à GGT (sedentos por saberem quais seriam as 'maravi- 
lhas chomskyanas”) quanto aqueles aprioristicamente avessos a um autor 
tão contundentemente contestado e ao mesmo tempo tão consagrado por 
mais de seis décadas (ávidos para esmiuçar cada furo que eu, chomskyano 
de tamanha audácia, deixasse escapar). Agora, na reta final, aquela mesma 
frase de efeito se pretende muito mais suave. Já estão apresentadas as tais 
vantagens amplas, bem como as tais falhas e incompletudes. O veredito final 
é seu, caro leitor. Entretanto, isso demanda muito mais do que digerir o que 
eu escrevi (e os muitos escritos que citei). Demanda também digerir toda 
uma vasta literatura técnica não chomskyana e também antichomskyana, 
que, por definição, não caberia aqui. 

E é suavemente que ora digo que, para uns tantos fenômenos gramati- 
cais isolados, ou classes de fenômenos, abordagens alternativas ou até mes- 
mo antagônicas à GGT oferecem explicações ótimas. No entanto, a GGT, a 
despeito de suas idealizações, abstrações e recortes (inevitáveis em qualquer 
modelo), é a teoria gramatical mais abrangente que há, a que tem maior 
escopo, cobrindo diversos níveis de representação numa única abordagem 
integrada. Dito isso, preciso fazer duas ressalvas. Primeiramente, por mais 
abrangente que a GGT seja, ela de fato não tem meios para cobrir todo o 
espectro daquilo que preteoricamente rotulamos como “linguagem huma- 
na”, Haveria muito o que se avançar para que se atingisse um modelo com 
propostas concretas sobre conexões entre o núcleo duro da gramática e a 


1. Seria isso realmente descjável? Frequentemente, há críticas ingênuas e equivocadas ale- 
gando que a GGT “não explica isso ou aquilo”. Mesmo quando verdade, isso não é necessa- 
riamente um problema. A GGT é uma teoria gramatical, e não tem obrigação de explicar, 
por exemplo, metáfora em poesia, ou os limites da traducibilidade. Seria igualmente desca- 
bido cobrar que certas teorias explicassem ilhas e lacunas parasitas. 
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pragmática e/ou com aspectos sociais do uso da linguagem. Em segundo 
lugar, ressalto que a afirmação que acabo de fazer sobre a maior abran- 
gência da GGT em comparação com as demais teorias contemporâneas é 
algo que precisaria ser devidamente demonstrado, não apenas afirmado. 
No entanto, isso demandaria uma longa exposição comparativa de deze- 
nas de abordagens, o que excederia os limites deste livro; e provavelmente 
a melhor maneira de se obter isso é através da consulta a obras de vários 
autores, e uma postura atenta e cética por parte do leitor. 

Antes de terminar, recapitulo os principais pontos gerais tratados 
no livro. 

O capítulo $1 foi uma breve introdução ao papel da persona de Chomsky 
como uma liderança no cenário científico internacional nas últimas seis 
décadas e meia. 

No capítulo $2, apresentei as bases conceituais e metodológicas nas 
quaisa GGT se sustenta, enfatizando a compreensão adequada do seu obje- 
to de estudo. Não se pode avaliar os resultados das pesquisas em GGT me- 
dindo-as com uma 'régua' estruturalista ou neoestruturalista que localize a 
linguagem fora da mente do indivíduo, pairando em algum lugar virtual no 
éter de um tecido social. Há que se distinguir apropriadamente entre dados 
e fatos, e reconhecer que os fatos sob investigação são fundamentalmente 
fatos sobre a cognição. Para se tratar a base empírica é preciso reconhecer 
as distinções entre (in)aceitabilidade e (a)gramaticalidade, entre dados po- 
sitivos e negativos, entre competência e desempenho. É preciso, também, 
compreender a estrutura em camadas de complexidade da pesquisa lin- 
guística, conforme o que Chomsky nomeou de níveis de adequação, desde 
o mais raso (a mera catalogação dos dados atestados ou não), até o mais 
profundo, que seria desvendar como o aparato neurofisiológico respon- 
sável pela linguagem humana se formou ao longo da evolução da espécie, 
passando por níveis intermediários como a identificação das propriedades 
da gramática codificada no cérebro do falante adulto, quais os seus corre- 
latos neurofisiológicos e como esse conhecimento gramatical se desenvolve 
no cérebro da criança. 
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Nos capítulos $3 e $4, demonstrei que a GGT é uma teoria gramatical 
que abrange a forma e o significado das expressões linguísticas. O estudo da 
forma compreende a sintaxe, a morfologia e a fonologia. A maneira como a 
GGT articula esses três aspectos da gramática toma uma parte considerável 
do que tradicionalmente se entende por morfologia como sendo, na verda- 
de, fruto de operações sintáticas. O modelo como um todo é sintaticocên- 
trico, no sentido de que a sintaxe intermedeia aspectos da fonologia (uma 
relação de interface que infelizmente não tive oportunidade de cobrir neste 
livro), da morfologia, e até mesmo daquilo que tradicionalmente se entende 
por semântica. Ou seja, a GGT concebe o significado como uma proprie- 
dade das próprias estruturas sintáticas, não como propriedade de uma es- 
trutura semântica construída a partir da sintaxe. Em suma, grosso modo na 
GGT, não há semântica no sentido estrito. Contudo, isso não implica que 
a GGT exclua de seu escopo questões acerca do significado das expressões 
linguísticas. Também é falsa a afirmação de que os pesquisadores da GGT 
conduzem suas pesquisas sobre o significado ignorando todo o legado de 
descrições e análises produzidas em quadros teóricos não sintaticocêntricos. 

No âmbito da sintaxe propriamente dita, a GGT entende que, para além 
dos mecanismos de combinação de ILs para formar estruturas mais com- 
plexas (da ordem de grandeza de sintagmas e sentenças: unidades que po- 
dem se encaixar umas nas outras infinitamente), fazem-se absolutamente 
necessários mecanismos de manipulação dessas unidades complexas em 
unidades ainda mais complexas. Grosso modo, isso equivale a dizer que 
a gramática estabelece relações de correspondência entre estruturas da 
ordem de grandeza de uma sentença; de modo que a estrutura sintática 
de uma sentença seriam duas (ou até três). Essas transformações não se 
aplicam de modo irrestrito. Há princípios proibitivos na gramática que li- 
mitam a aplicação de transformações a certos domínios locais específicos 
dentro do material sentencial a ser afetado. 

Mais recentemente, com o advento do PM, entende-se que a gramática 
tem o formato que tem porque precisa satisfazer as demandas dos sistemas 
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de desempenho (articulatório-perceptual e conceptual-intensional) que 
fazem interface com a gramática, efetivamente pondo-a em uso. À primei- 
ra vista, isso, em parte, parece aproximar a GGT de modelos funcionalistas 
(cf. Givón 1979, inter alia), segundo os quais, grosso modo, “a forma segue 
a função” ou “a gramática se molda às necessidades de comunicação”, En- 
tretanto, um exame mais minucioso do PM revela que, embora algumas 
concessões tenham sido feitas nesse sentido”,a GGT continua tão sintatico- 
cêntrica quanto antes, portanto fortemente formalista. 

Retomando aspectos introduzidos no capítulo $2, elaborei no capítulo 
$5 o tema do forte compromisso da GGT com a realidade psicológica da 
gramática, bem como a plausibilidade de o sistema postulado ser efetiva- 
mente adquirido por uma criança típica, em situações típicas de exposi- 
ção a dados linguísticos, contendo bastante “ruído! e não contendo certas 
informações-chave para decidir sobre quais mecanismos gramaticais são 
operantes, o que interfere decisivamente para determinar quais dados são 
(a)gramaticais entre aqueles que a criança jamais escutou, e que ela, se não 
estiver previamente enviesada, poderia decidir, como que “por sorteio) en- 
tre as infinitas (literalmente infinitas) hipóteses logicamente possíveis. A 
GGT não é apenas a abordagem que mais leva a sério a gramática enquanto 
capacidade cognitiva, mas também a que oferece um modelo explicativo 
unificado mais abrangente, cobrindo um grande número de fenômenos 
relativos a como a criança se comporta no processo de aquisição de lingua- 
gem, quais decisões ela toma ou não toma, com base numa experiência tão 
escassa de informações essenciais por um lado, e tão cheia de informações 
irrelevantes e enganadoras por outro. Tudo isso implica que a GGT tem um 
compromisso com o inatismo, para o qual o principal argumento é o da 


2. No que tange à fonologia, Hauser et al. (2002), Fitch et al. (2005) e Chomsky (2005) 
compreendem-na como sendo em grande parte governada por mecanismos externos à 
gramática propriamente dita. Contudo, tal posição não é compartilhada pela maioria dos 
fonólogos que trabalham no quadro teórico da GGT. 


355 


Pobreza de Estímulo, que foi o objeto central do capítulo $5, que também 
abordou duas ramificações disso. 

Uma dessas questões refere-se a uma crítica antiga, reciclada há décadas, 
que consiste em afirmar que o inatismo seria um apelo à ignorância, um 
deus ex machina que nada explicaria, uma confissão velada de que não se 
sabe como a criança aprende padrões gramaticais, e, diante disso, estipu- 
la-se uma GU inata para fugir do problema, declarando que os padrões não 
teriam sido aprendidos exatamente por serem inatos. Apresentei o contra- 
-argumento a essa crítica, mostrando que o inatismo é uma proposta fal- 
seável 
ou refutadas via observações controladas), mas que não foi falseada como 
um todo ao longo das últimas cinco décadas, aproximadamente, quando o 


. faz previsões empíricas concretas que podem ser corroboradas 


inatismo se tornou uma parte central da GGT. 

Outro ponto ressaltado é que o aparato do qual a GGT dispõe para lidar 
com questões relativas ao desenvolvimento da linguagem infantil é o mes- 
mo do qual a teoria dispõe para lidar com questoes de variação linguística. 
Isso torna a GGT particularmente atrativa e digna de ser explorada. Vistas 
por um ângulo, as várias línguas do mundo são notavelmente diferentes 
umas das outras. Vistas por outro ângulo, elas são bastante iguais umas 
às outras. Os conceitos de princípio e de parâmetro, uma vez integrados, 
conciliam universalidade e variação de uma maneira que nenhuma outra 
abordagem sequer tentou. 


56.2. DANDO SEQUÊNCIA 


Para dar continuidade ao estudo da obra chomskyana e da GGT em 
geral, começo fazendo a recomendação óbvia. Siga o roteiro aqui traça- 
do (permitindo-se desvios, atalhos, paralelas, tangentes, perpendiculares, 
é claro, pois a viagem é sua) e leia a literatura técnica que cito e comento 
neste livro, bem como as demais obras lá referenciadas. 

Além disso, fazem-se pertinentes algumas recomendações complemen- 
tares de obras que abordam questões importantes que não tive oportuni- 
dade de tratar aqui. 
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Primeiramente, é importante avaliar os méritos e os deméritos da GGT 
em relação às alternativas concretas existentes. Qualquer teoria gramatical 
está longe de ser perfeita, mas umas são mais imperfeitas que outras, quer 
globalmente, quer em relação a aspectos pontuais da gramática. Para com- 
preender Chomsky plenamente é preciso também compreender seus críti- 
cos, dos mais amigáveis aos inimigos ferozes. Entre as abordagens teóricas 
importantes que devem ser estudadas, certamente é preciso compreender 
os aspectos essenciais das seguintes: Gramática Categorial (Moortgart 1988; 
Morrill 1994), Gramática Categorial Combinatória (Steedman 1996, 2000), 
Gramática de Estrutura Sintagmática Generalizada (Gazdar et al. 1985; Hu- 
kari & Levine 1986; Bennett 1995; Borsley 1996), Gramática de Estrutura 
Sintagmática Guiada por Núcleo (Pollard & Sag 1994; Borsley 1996), Gra- 
mática Léxico-Funcional (Bresnan 2001; Dalrymple 2001), Fonologia Arti- 
culatória (Browman & Goldstein 1986, 1989, 1992) e Sintaxe Mais Simples 
(Culicover & Jackendoff 2005). Há alguns modelos teóricos que nasceram 
no seio da GGT e ganharam vida própria, configurando-se numa vertente 
independente dos estudos gramaticais, sem, no entanto, jamais deixarem 
de compartilhar com a GGT uma série de aspectos cruciais. Este é o caso da 
Teoria de Otimalidade (Prince & Smolensky 2004 [1993]; McCarthy & Prin- 
ce 1993; Kager 1999; McCarthy 2008) e Gramática de Adjunção de Árvores 
(Kroch & Joshi 1985; Kroch 1987; Vijay-Shanker 1987; Abeillé & Rambow 
2000; Frank 2002, 2013). 

Quanto ao formalismo matemático empregado na GGT, é importan- 
tíssimo conhecer certas ferramentas técnicas cuja origem e natureza es- 
tão acima da GGT, constituindo uma base para todas as teorias formais de 
gramática. Algumas obras de referência são: Hockett (1962), Gross (1972), 
Wall (1972), Partee (1978), McCawley (1981), Gamut (1991a, 1991b), Par- 
tee et al. (1993), Boolos (1998), Kolb & Mônnich (1999), Mortari (2001), 
Kracht (2003) e Kornai (2008). 

São de suma relevância obras que escrutinam aspectos técnicos e prin- 
cipalmente filosófico-epistemológicos do paradigma chomskyano, com 
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reflexões relevantes de autores favoráveis e desfavoráveis à visão chomskya- 
na de gramática, a exemplo de Hockett (1968), Harman (1974), Matthews 
(1979, 2007), Moore & Carling (1982), Newmeyer (1983, 2005), Modgil & 
Modgil (1985), D'Agostinho (1986), George (1989), Otero (1994), Culico- 
ver & McNally (1998), Stone & Davies (2002), Antony & Hornstein (2003), 
Smith (2004 [1999]) e McGilvray (2005). Nesse contexto, recomendo for- 
temente toda a obra do filósofo Jerry Fodor, cuja concepção de mente mo- 
dular é uma das bases para o inatismo gramatical. Ainda sobre modulari- 
dade e inatismo, são muitíssimo relevantes os trabalhos do etólogo Charles 
R. Gallistel sobre cognição em não humanos. 

Também são cruciais obras de historiografia da linguística que tratam 
da GGT, como Sampson (1980), Matthews (1993), Newmeyer (1980, 1986, 
1996), Harris (1993), Huck & Goldsmith (1995), Graffi (2001), Tomalin 
(2006) e Kibbee (2010). 
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